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La pr6sente invention est relative a une nouvelle souche de corona- 
virus assocte au syndrome respiratoire aigu severe (SRAS), issue d'un pr616vement 
repertorie sous le n° 031589 et preleve a Hanoi (Vietnam), a des molecules d'acide 
nucl6ique issues de son genome, aux proteines et peptides codes par lesdites 
5 molecules d'acide nucleique ainsi qu'a leurs applications, notamment en tant que reac- 
tifs de diagnostic et/ou comrae vaccin. 

Le coronavirus est un virus a ARN monocat6naire, de polarite posi- 
tive, d'approximativement 30 kilobases qui se replique dans le cytoplasme des cellules 
hotes ; Fextremite 5 s du genome a une structure en coiffe et Fextremite 3 9 comporte 
10 une queue polyA. Ce virus est enveloppe et comprend, a sa surface, -des structures 
peplomeriques- denomm6es spicules. 

Le genome comprend les cadres ouverts de lecture ou ORF suivants, 
de son extremity 5' vers son extremite 3* : ORF la et ORF lb correspondant aux 
proteines du complexe de transcription-replication, et ORF-S, ORF-E, ORF-M et 
1 5 ORF-N correspondant aux proteines structural es S, E, M et N. II comprend egalement 
des ORFs correspondant a des proteines de fonction inconnue codees par : la region 
situee entre FORF-S et FORF-E et chevauchant cette derniere, la region situee entre 
r ORF-M et 1'ORF-N, et la region incluse dans I' ORF-N. 

La proteine S est une glycoprotein membranaire (200-220 kDa) qui 
20 se presente sous la forme de spicules ou "Spike" emergeant de la surface de 
Fenveloppe virale. Elle est responsable de Tattachement du virus aux rScepteurs de la 
cellule hote et de l'induction de la fusion de Tenveloppe virale avec la membrane 
cellulaire. 

La petite proteine d'enveloppe (E) egalement denommee sM {small 
25 membrane) qui est une proteine trans-membranaire non glycosylee d' environ 10 kDa, 
est la proteine pr6sente en plus faible quantite dans le virion. Elle joue un role moteur 
dans le processus de bourgeonnement des coronavirus qui se produit au niveau du 
compartiment intermediaire dans le reticulum endoplasmique et Tappareil de Golgi 

La proteine M ou proteine de matrice (25-30 kDa) est une glyco- 
30 proteine membranaire plus abondante qui est integree dans la particule virale par une 
interaction M/E, tandis que Fincorporation de S dans les particules est dirigee par une 
interaction S/M. Elle semble etre importante pour la maturation virale des coronavirus 
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et pour la determination du site au niveau duquel les particules virales sont assem- 
blies. 

La proteine N ou proteine de nucleocapside (45-50 kDa) qui est la 
plus conservee parmi les proteines structurales des coronavirus, est necessaire pour 

5 encapsider l'ARN genomique puis pour dinger son incorporation dans le virion. Cette 
proteine est vraisemblablement egalement impliquee dans la replication de l'ARN. 

Lorsqu'une cellule bote est infectee, le cadre de lecture (ORF) situe 
en 5' du genome viral est traduit en une polyproteine qui est clivee par les proteases 
virales et libere alors plusieurs proteines non-structurales telles que l'ARN- 

10 polymerase ARN dependante (Rep) et l'ATPase helicase (Hel). Ces deux proteines 
sont impliquees dans la replication du genome viral ainsi que dans la generation de 
transcrits qui sont utilises dans la synthese des proteines virales. Les mecanismes par 
lesquels ces ARNms sub-genomiques sont produits, ne sont pas complement 
compris ; cependant des faits recents indiquent que les sequences de regulation de la 

15 transcription a l'extremite 5' de chaque gene represented des signaux qui regulent la 
transcription discontinue des ARNms sub-genomiques. 

Les proteines de la membrane virale (prolines S, E et M) sont inse- 
rts dans le compartiment intermediate, alors que l'ARN replique (brin +) s' assemble 
avec la proteine N (nucleocapside). Ce complexe prot6ine-ARN s'associe ensuite avec 

20 la prot6ine M incluse dans les membranes du reticulum endoplasmique et les 
particules virales se forment lorsque le complexe de la nucleocapside bourgeonne dans 
le reticulum endoplasmique. Le virus migre ensuite a travers le complexe du Golgi et 
eventuellement sort de la cellule, par exemple par exocytose. Le site de l'attachement 
du virus a la cellule hote se trouve au niveau de la protdine S. 

25 Les coronavirus sont responsables de 15 a 30 % des rhumes chez 

l'Homme et d'infections respiratoires ou digestives chez les animaux, notamment le 
chat (FIPV : Feline infectious peritonitis virus), la volaille (IBV : Avian Infectious 
bronchitis virus), la souris (MHV : Mouse Hepatitis virus), le pore (TGEV : 
Transmissible gastroenterititis virus, PEDV : Porcine Epidemic Diarrhea virus, 

30 PRCoV : Porcine Respiratory Coronavirus, HEV : Hemagglutinating encephalo- 
myelitis Virus) et les bovins (BcoV : Bovine coronavirus). 
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En general, chaque coronavirus n'affecte qu'une seule espece ; chez 
les individus immunocompetents, Pinfection induit des anticorps 6ventuellement 
neutralisants et une immunite cellulaire, capables de detruire les cellules infectees. 

Une epidemie de pneumonie atypique, denommee syndrome respi- 
5 ratoire aigu severe (SARS ou Severe acute respiratory syndrome, SRAS en fran9ais) 
s'est propagee dans differents pays (Vietnam, Hong-Kong, Singapour, Thailande et 
Canada) au cours du premier trimestre 2003, a partir d'un foyer initial apparu en 
Chine dans le dernier trimestre de 2002. La severite de cette maladie est telle que son 
taux de mortalite est d'environ 3 a 6 %. La determination de Tagent causatif de cette 
1 0 maladie a ete entreprise par de nombreux laboratoires, a travers le monde. 

En mars 2003, un nouveau coronavirus (SARS-CoV, SARS virus ou 
virus SRAS, en fran9ais) a ete isole, en association avec des cas de syndrome respi- 
ratoire aigu severe (T.G.KSIAZEK et aL, The New England Journal of Medicine, 
2003, 348, 1319-1330 ; C. DROSTEN et aL, The New England Journal of Medicine, 
15 2003, 348, 1967-1976 ; Peiris et ah, Lancet, 2003, 361, 13 19-). 

Des sequences genomiques de ce nouveau coronavirus ont ainsi ete 
obtenues, notamment celles de Pisolat Urbani (Genbank n° d'acces AY2741 19.3 et A. 
MARRA et aL, Science, May 1, 2003, 300, 1399-1404) et de 1'isolat de Toronto 
(Tor2, Genbank n° d'acces AY 278741 et A. ROTA et aL, Science, 2003, 300, 1394- 
20 1399). 

L'organisation du genome est comparable a celle des autres corona- 
virus connus permettant ainsi de confirmer Tappartenance du SARS-CoV a la famille 
des Coronaviridae ; les cadres ouverts de lecture ORFla et lb et les cadres ou verts de 
lecture correspondant aux proteines S, E, M, et N, ainsi qu'a des proteines codees par : 

25 la region situee entre TORF-S et PORF-E (ORF3), la region situee entre l'ORF-S et 
rORF-E et chevauchant l'ORF-E (ORF4), la region situ6e entre TORF-M et l'ORF-N 
(ORF7 a ORF11) et la region correspondant a TORF-N (ORF13 et ORF14), ont 
notamment ete identifies. 

Sept differences ont ete mises en evidence entre les sequences des 

30 isolats Tor2 et Urbani ; 3 correspondent a des mutations silencieuses (c/t en position 
16622 et a/g en position 19064 de FORFlb, t/c en position 24872 de l'ORF-S) et 4 
modifient la sequence en acides amines de respectivement : les proteines codees par 
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TORFla (c/t en position 7919 correspondant h la mutation A/V), la proteine S (g/t en 
position 23220 correspondant a la mutation A/S), la proteine cod6e par TORF3 (a/g en 
position 25298 correspondant a la mutation R/G) et de la proteine M (t/c en position 
26857 correspondant a la mutation S/P). 
5 En outre, 1* analyse phylog&ietique montre que le SARS-CoV est 

eloigne des autres coronavirus et qu'il est apparu, ni par mutation de coronavirus 
respiratoires humains, ni par recombinaison entre des coronavirus connus (pour une 
revue, voir Holmes, J.C.L, 2003, 111, 1605-1609). 

La mise en evidence et la prise en compte de nouveaux variants sont 

10 importantes pour la mise au point de rSactifs de detection et de diagnostic du SRAS 
suffisamment sensibles et specifiques ainsi qu'a des compositions immunogenes aptes 
a proteger des populations contre des epidemies de SRAS. 

Les Inventeurs ont maintenant mis en evidence une autre souche de 
coronavirus associe au SRAS, qui se distingue des isolats Tor2 et Urbani. 

15 La pr6sente invention a done pour objet, une souche isolee ou puri- 

fi6e de coronavirus humain associe au syndrome respiratoire aigu severe, caracterisee 
en ce que son genome presente sous la forme d' ADN complementaire un codon serine 
en position 23220-23222 du gene de la proteine S ou un codon glycine en position 
25298-25300 du gene de l'ORF3, et un codon alanine en position 7918-7920 de 

20 PORFla ou un codon serine en position 26857-26859 du gene de la proteine M, 
lesdites positions 6tant indiquees en r6ference a la s6quence Genbank AY2741 19.3. 

Selon un mode de realisation avantageux de ladite souche, 
Fequivalent ADN de son genome pr6sente une sequence correspondant a la sequence 
SEQ ID NO : 1 ; cette souche de coronavirus est issue du pr&evement de lavage 

25 bronchoalv^olaire d'un patient atteint de SRAS, r6pertori6 sous le n° 031589 et 
effectue a Thopital fran^ais de Hanoi (Vietnam). 

Conformement a V invention, ladite sequence SEQ ID NO :l est 
celle de Tacide d&oxyribonucleique correspondant a la molecule d'acide 
ribonucleique du genome de la souche isolee de coronavirus telle que definie ci- 

30 dessus. 

La sequence SEQ ID NO : 1 se distingue de la sequence Genbank 
AY2741 19.3 (isolat Tor2) en ce qu'ellepossede les mutations suivantes : 
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- g/t en position 23220 ; le codon alanine (get) en position 577 de la 
sequence en acides amines de la proteine S de Tor2 est remplac6 par un codon serine 
(tct), 

- a/g en position 25298 ; le codon arginine (aga) en position 11 de la 
5 sequence en acide amines de la prot&ne codee par FORF3 de Tor 2 est remplac6 par 

un codon glycine (gga). 

En outre, la sequence SEQ ID NO : 1 se distingue de la sequence 
Genbank AY278741 (isolat Urbani) en ce qu'ellepossede les mutations suivantes : 

- t/c en position 7919 ; le codon valine (gtt) en position 2552 de la 
10 sequence en acides amines de la prot&ne codee par TORFla est remplace par un 

codon alanine (get), 

- t/c en position 16622 : cette mutation ne modifie pas la sequence 
en acides amines des proteines codees par l'ORFlb (mutation silencieuse), 

- g/a en position 19064 : cette mutation ne modifie pas la sequence 
1 5 en acides amines des proteines codees par FORFlb (mutation silencieuse), 

- c/t en position 24872 : cette mutation ne modifie pas la sequence 
en acides amines de la proteine S, et 

- c/t en position 26857 : le codon proline (ccc) en position 154 de la 
sequence en acides amines de la proteine M est remplace par un codon serine (tec). 

20 En Fabsence de mention particuliere, les positions des sequences 

nucleotidiques et peptidiques sont indiqu6es en reference h la sequence Genbank 
AY2741193. 

La presente invention a egalement pour objet un polynucleotide isole 
ou purifte, caracterise en ce que sa s6quence est celle du genome de la souche isolee 
25 de coronavirus telle que d^finie ci-dessus. 

Selon un mode de realisation avantageux dudit polynucleotide il 
presente la sequence SEQ ID NO : 1. 

La presente invention a egalement pour objet un polynucleotide isole 
ou purifie, caracterise en ce que sa sequence hybride dans des conditions de forte 
30 stringence avec la sequence du polynucleotide tel que defini ci-dessus. 

Les termes « iso!6 ou purifie » signifient modifie « par la main de 
Fhomme » a partir de Tetat naturel ; autrement dit si un objet existe dans la nature, il 



est dit isole ou purif.6 s'il a ft* modifie ou extrait de son environnement naturel ou les 
deux Par exemple, un polynucleotide ou une proteine/un peptide naturellement 
present dans un organisme vivant n'est ni isole, ni purifie ; en revanche le mftne poly- 
nucleotide ou proteine /peptide separe des molecules coexistantes dans son environ- 
5 nement naturel, obtenu par clonage, amplification et/ou synthese chimique est iso!6 au 
sens de la presente invention- De plus, un polynucleotide ou une proteine/peptide qui 
est introduit dans un organisme par transformation, manipulation genetique ou par 
toute autre methode, est « isole » meme s'il est present dans ledit organisme. Le terme 
purifie tel qu'utilis6 dans la presente invention, signifie que les proteines /peptides 
10 selon Invention sont essentiellement libres ^association avec les autres proteines ou 
polypeptides, comme l'est par exemple le produit purifie de la culture de cellules 
notes recombinantes ou le produit purifie a partir d'une source non-recombinante. 

Au sens de la presente invention, on entend par conditions d-hybri- 
dation de forte stringency des conditions de tempdrature et de force ionique choisies 
15 de telle maniere qu'elles permettent le maintien de hybridation specifique et selective 
entre polynucleotides complementaires. 

A titre d'illustration, des conditions de forte stringence aux fins de 
definir les polynucleotides ci-dessus, sont avantageusement les suivantes : hybrida- 
tion ADN-ADN ou ADN-ARN est realisee en deux etapes : (1) prehybridation a 42°C 
20 pendant 3 heures en tampon phosphate (20 mM pH 7,5) contenant 5 x SSC (1 x SSC 
correspond a une solution 0,15 M NaCl + 0, 015 M citrate de sodium), 50 % de 
formamide, 7 % de sodium dodecyl sulfate (SDS), 10 x Denhardfs, 5 % de dextran 
sulfate et 1 % dADN de sperme de saumon ; (2) hybridation pendant 20 heures a 
42°C suivie de 2 lavages de 20 minutes a 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 
25 minutes a 20°C en 0,1 x SSC + 0,1 % SDS. Le dernier lavage est pratique en 0,1 x 
SSC + 0,1 % SDS pendant 30 minutes a 60°C. 

La presente invention a egalement pour objet un fragment represen- 
tatif du polynucleotide tel que defini ci-dessus, caracteris6 en ce qu'il est susceptible 
d'etre obtenu, soit par l'utilisation d'enzymes de restriction dont les sites de 
30 reconnaissance et de coupure sont pr6sents dans ledit polynucleotide tel que defini ci- 
dessus, soit par amplification a l'aide d'amorces oligonucldotidiques specifiques dudit 
polynucleotide tel que defini ci-dessus, soit par transcription in vitro, soit par synthese 
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chimique. 

Selon un mode de realisation avantageux dudit fragment, il est selec- 
tionne dans le groupe constitue par : PADNc correspondant a au moins un cadre 
ouvert de lecture (ORF) choisi parmi : ORFla, ORFlb, ORF-S, ORF-E, ORF-M, 
5 ORF-N, ORF3, ORF4, ORF7 a ORF11, ORF13 et ORF14, et PADNc correspondant 
aux extr6mites 5' ou 3' non-codantes dudit polynucleotide. 

Selon une disposition avantageuse de ce mode de realisation, ledit 
fragment presente une sequence selectionnee dans le groupe constitue par : 

- les sequences SEQ ID NO : 2 et 4 repr6sentant PADNc corres- 
1 0 pondant a PORF-S qui code pour la proteine S, 

- les sequences SEQ ID NO : 13 et 15 repr6sentant l'ADNc corres- 
pondant a P ORF-E qui code pour la proteine E, 

- les sequences sequence SEQ ID NO: 16 et 18 representant 
l'ADNc correspondant a PORF-M qui code pour la prot&ne M, 

15 - les sequences SEQ ID NO ; 36 et 38 representant l'ADNc corres- 

pondant a PORF-N qui code pour la prot6ine N, 

- les sequences representant les ADNc correspondant respective- 
ment : aux ORFla et ORFlb (ORFlab, SEQ ID NO : 31), aux ORF3 et ORF4 (SEQ 
ID NO : 7, 8), aux ORF 7 & 11 (SEQ ID NO : 1 9, 20), k PORF13 (SEQ ID NO : 32) et 

20 a TORF14 (SEQ ID NO : 34), et 

- les sequences representant les ADNc correspondant respectivement 
aux extremites 5'(SEQ ID NO : 39 et 72) et 3' non-codantes (SEQ ID NO : 40, 73) 
dudit polynucleotide. 

La presente invention a egalement pour objet un fragment de 
25 PADNc codant pour la proteine S, tel que defini ci-dessus, caracterise en ce qu'il 
presente une sequence s&ectionnee dans le groupe constitue par les sequences SEQ ID 
NO : 5 et 6 (fragments Sa et Sb). 

La presente invention a egalement pour objet un fragment de 
PADNc correspondant aux ORFla et ORFlb tel que defini ci-dessus, caracterise en ce 
30 qu'il presente une sequence selectionnee dans le groupe constitue par les sequences 
SEQ ID NO : 41 a 54 (fragments L0 a LI 2). 
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La presente invention a 6galement pour objet un fragment du poly- 
nucleotide tel que defini ci dessus, caracterise en ce qu'il presente au moins 15 bases 
ou paires de bases consecutives de la sequence du genome de ladite souche incluant au 
moins une de celles situees en position 7979, 16622, 19064, 23220, 24872, 25298 et 
5 26857. De preference, il s'agit d'un fragment de 20 a 2500 bases ou paires de bases, 

de maniere preferee de 20 a 400. 

Selon un mode de realisation avantageux dudit fragment, il inclut au 
moins un couple de bases ou de paires de bases correspondant aux positions 
suivantes : 7919 et 23220, 7919 et 25298, 16622 et 23220, 19064 et 23220, 16622 et 
10 25298, 19064 et 25298, 23220 et 24872, 23220 et 26857, 24872 et 25298, 25298 et 
26857. 

La pr6sente invention a egalement pour objet des amorces d'au 
moins 1 8 bases aptes a amplifier un fragment du genome d'un coronavirus associe au 
SRAS ou de 1'equivalent ADN de celui-ci. 
j 5 Selon un mode de realisation desdites amorces, elles sont selection- 

nees dans le groupe constitue par : 

- lapaire d'amorces n p 1 correspondant respectivement aux positions 
28507 a 28522 (amorce sens, SEQ ID NO : 60) et 28774 a 28759 (amorce anti-sens, 
SEQ ID NO : 61) de la sequence du polynucleotide tel que defini ci-dessus, et 
2 0 - la paire d'amorces n° 2 correspondant respectivement aux positions 

28375 a 28390 (amorce sens, SEQ ID NO : 62) et 28702 a 28687 (amorce anti-sens, 
SEQ ID NO : 63) de la sequence du polynucleotide tel que defini ci-dessus. 

La presente invention a 6galement pour objet une sonde apte a 
detecter la presence du g6nome d'un coronavirus associe au SRAS ou d'un fragment 
25 de celui-ci, caracteris6e en ce qu'elle est selectionnee dans le groupe constitue par : les 
fragments tels que definis ci-dessus et les fragments correspondant aux positions 
suivantes de la sequence du polynucleotide tel que defini ci-dessus : 28561 a 28586, 
28588 a 28608, 28541 a 28563 et 28565 a 28589 (SEQ ID NO : 64 a 67). 

Les sondes et amorces selon l'lnvention peuvent etre marquees 
30 directement ou indirectement par un compose radioactif ou non radioactif par des 
methodes bien connues de l'Homme du Metier, afin d'obtenir un signal detectable 
et/ou quantifiable. Parmi les isotopes radioactifs utilis6s, on peut citer le 32 P, le 33 P, le 
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35 S, le 3 H ou P 125 L Les entites non radioactives sont s61ectionnees parmi les ligands 
tels que la biotine, l'avidine, la streptavidine, la digoxygenine, les haptenes, les colo- 
rants, les agents luminescents tels que les agents radioluminescents, chemolurnines- 
cents, bioluminescents, fluorescents, phosphorescents. 
5 L'invention englobe les sondes et les amorces marquees derivees des 

sequences precedentes. 

De telles sondes et amorces sont utiles pour le diagnostic de 
Tinfection par un coronavirus associe au SRAS. 

La pr&ente invention a egalement pour objet une methode de deteo 
10 tion d'un coronavirus associe au SRAS, a partir d'un echantillon biologique, laquelle 
methode est caracterisee en ce qu'elle comprend au moins : 

(a) Textraction d'acides nucleiques presents dans ledit echantillon 

biologique, 

(b) l'amplification d'un fragment de 1'ORF-N par RT-PCR a l'aide 
1 5 d'une paire d'amorces telle que definie ci-dessus, et 

(c) la detection par tout moyen approprie des produits 
d'amplifications obtenus en (b). 

Les produits d'amplifications (amplicons) en (b) sont de 268 pb pour 
la paire d'amorces n° 1 et de 328 pb pour la paire d'amorces n°2. 

20 Selon mode de mise en ceuvre avantageux dudit procdde, l'etape 

(b) de detection est realisee h l'aide d'au moins une sonde correspondant aux positions 
28561 a 28586, 28588 a 28608, 28541 a 28563 et 28565 a 28589 de la sequence du 
polynucleotide tel que defini ci-dessus. 

De preference, le genome du coronavirus associe au SRAS est 

25 detecte et eventuellement quantifie par PCR en temps reel, a l'aide de la paire 
d'amorces n°2 et des sondes correspondant aux positions 28541 a 28563 et 28565 a 
28589 marquees avec des composes differents, notamment des agents fluorescents 
differents. 

La RT-PCR en temps r6el qui met en oeuvre cette paire d'amorces et 
30 cette sonde est tres sensible puisqu'elle permet de detecter 10 2 copies d'ARN et jusqu'a 
10 copies d'ARN, elle est en outre fiable et reproductible. 
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L'invention englobe les polydesoxyribonucleotides et les polyribo- 
nucleotides simple-brin, double-brin et tripe-brin correspondant a la sequence du 
genome de la souche isolee de coronavirus et de ses fragments tels que definis ci- 
dessus, ainsi qu'a leurs sequences complementaires, sens ou anti-sens, notamment les 
5 ARN et les ADNc correspondant a la sequence du genome et de ses fragments tels que 
definis ci-dessus. 

La presente invention englobe egalement les fragments 
d'amplification obtenus a l'aide d' amorces specifiques du genome de la souche puri- 
fiee ou isolee tel que d6fini ci-dessus, notamment a l'aide d'amorces et de paires 
10 d'amorces telles que definies ci-dessus, les fragments de restriction consumes par ou 
comprenant la s6quence des fragments tels que definis ci-dessus, les fragments obte- 
nus par transcription in vitro a partir d'un vecteur contenant la s6quence SEQ ID NO : 
1 ou un fragment tel que defini ci-dessus, ainsi que des fragments obtenus par 
synthese chimique. Des exemples de fragments de restriction sont deduits de la carte 
15 de restriction de la sequence SEQ ED NO : 1 illustree par la figure 13. Conformement 
a l'invention lesdits fragments sont, soit sous forme de fragments isoles, soit sous 
forme de melanges de fragments. L'invention englobe egalement les fragments modi- 
fies, par rapport aux precedents, par enlevement, ou addition de nucleotides dans une 
proportion d'environ 15 %, par rapport a la longueur des fragments ci-dessus et/ou 
20 modifies au niveau de la nature des nucleotides, des lors que les fragments nucleo- 
tidiques modifies conservent une capacite d'hybridation avec les sequences d'ARN 
genomiques ou antig6nomiques de l'isolat tel que defini ci-dessus. 

Les molecules d'acide nucleique selon l'invention sont obtenues par 
les methodes classiques, connues en elles-memes, en suivant les protocoles standards 
25 tels que ceux decrits dans Current Protocols in Molecular Biology (Frederick M. 
A USUBEL, 2000, Wiley and son Inc. Library of Congress, USA). Par exemple, elles 
peuvent etre obtenues par amplification d'une sequence nucleique par PCR ou RT- 
PCR ou bien par synthese chimique totale ou partielle. 

La presente invention a egalement pour objet une puce ou filtre a 
30 ADN ou a ARN, caracterise en ce qu'il comprend au moins un polynucleotide ou l'un 
de ses fragments tels que definis ci-dessus. 

Les puces ou filtres a ADN ou a ARN selon l'invention sont 
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prepares par les methodes classiques, connues en elles-memes, corame par exemple 
greffage chimique ou electrochimique d'oligonucleotides sur support de verre ou de 
nylon. 

La presente invention a 6galement pour objet un vecteur de clonage 
5 et/ou d'expression recombinant, notamment un plasmide ou un phage comprenant vm 
fragment d'acide nucleique tel que defini ci-dessus. De preference, ledit vecteur 
recombinant est un vecteur d r expression dans leque] ledit fragment d T acide nucleique 
est place sous le controle d'elements regulateurs de la transcription et de la traduction 
appropries. En outre, ledit vecteur peut comprendre des sequences (Etiquettes ou tag) 
10 fusionnees en phase avec rextremitS 5' et/ou 3' dudit insert, utiles pour Timmobilisa- 
tion, et/ou la detection et/ou la purification de la proteine exprimee a partir dudit 
vecteur. 

Ces vecteurs sont constructs et introduits dans des cellules hotes par 
les methodes classiques d'ADN recombinant et de genie gen&ique, qui sont connues 

15 en elles-memes. De nombreux vecteurs dans lesquels on peut inserer une molecule 
d'acide nucleique d'interet afm de Fintroduire et de la maintenir dans une cellule h6te, 
sont connus en eux-memes ; le choix d'un vecteur appropri6 depend de Tutilisation 
envisagSe pour ce vecteur (par exemple replication de la sequence d'interet, expres- 
sion de cette sequence, maintien de la sequence sous forme extrachromosomique ou 

20 bien integration dans le materiel chromosomique de Fhote), ainsi que de la nature de la 
cellule hote. 

Conform6ment a 1'invention, ledit plasmide est notamment selec- 
tion!^ parmi les plasmides suivants : 

- le plasmide, denomme SARS-S, compris dans la souche bacte- 
25 rienne deposee sous le n° 1-3059, le 20 juin 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15; il 
contient la sequence d'ADNc codant pour la proteine S de la souche de SARS-CoV 
issue du prelevement repertorie sous le n° 031589, laquelle sequence correspondant 
aux nucleotides des positions 21406 a 25348 (SEQ ID NO : 4), en reference a la 
30 sequence Genbank AY274 1 1 9.3, 

- le plasmide, d6nomm6 SARS-S 1, compris dans la souche bact<§- 
rienne deposee sous le n° 1-3020, le 12 mai 2003, aupres de la Collection Nationale de 
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Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
contient un fragment 5' de la sequence d'ADNc codant pour la proteine S de la souche 
de SARS-CoV issue du prelevement repertorie sous le n° 031589, telle que definie ci- 
dessus, lequel fragment correspondant aux nucldotides des positions 21406 a 23454 
5 (SEQ ID NO :5), en reference a la sequence Genbank AY2741 19.3 Tor2, 

- le plasmide, denomme SARS-S2, compris dans la souche bacte- 
rienne deposee sous le n° 1-3019, le 12 mai 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
contient un fragment 3'de la sequence d'ADNc codant pour la proteine S de la souche 
10 de SARS-CoV issue du prelevement repertorie sous le n° 031589, telle que definie ci- 
dessus, lequel fragment correspondant aux nucleotides des positions 23322 a 25348 
(SEQ ID NO :6), en r6ference a la sequence Genbank n° d'acces AY2741 19.3, 

- le plasmide, denomme SARS-SE, compris dans la souche bacte- 
rienne deposee sous le n° 1-3126, le, 13 novembre 2003, aupres de la Collection ' 

15 Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15; il contient l'ADNc correspondant a la region siruee entre l'ORF-S et 
l'ORF-E et chevauchant l'ORF-E de la souche de SARS-CoV issue du prelevement 
repertorie sous le n° 031589, telle que definie ci-dessus, laquelle region correspondant 
aux nucleotides des positions 25110 a 26244 (SEQ ID NO :8), en reference a la 

20 sequence Genbank n° d'acces AY2741 19.3, 

- le plasmide, denomme SARS-E, compris dans la souche bacte- 
rienne deposee sous le n° 1-3046, le 28 mai 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
contient la sequence d'ADNc codant pour la proteine E de la souche de SARS-CoV 

25 issue du prelevement repertorie sous le n° 031589, telle que d6finie ci-dessus, laquelle 
sequence correspondant aux nucleotides des positions 26082 a 26413 (SEQ ID 
NO :1 5), en reference a la sequence Genbank n° d'acces AY2741 19.3, 

- le plasmide, denomme SARS-M ; compris dans la souche bacte- 
rienne deposee sous le n° 1-3047, le 28 mai 2003, aupres de la Collection Nationale de 

30 Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
contient la sequence d'ADNc codant pour la proteine M de la souche de SARS-CoV 
issue du prelevement repertorie sous le n° 031589, telle que definie ci-dessus; 
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laquelle sequence correspondant aux nucleotides des positions 26330 a 27098 (SEQ 
ID NO :1 8), en reference a la sequence Genbank n° d'acces AY2741 1 9.3, 

- le plasmide denomme SARS-MN, compris dans la souche bacte- 
rienne deposee sous le n° 1-3125, le 13 novembre 2003, aupres de la Collection 

5 Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15 ; il contient la sequence d'ADNc correspondant a la region situee entre 
l'ORF-M et FORF-N de la souche de SARS-CoV issue du pr&evement repertorie 
sous le n° 031589 et prelevee a Hanoi, telle que definie ci-dessus, laquelle sequence 
correspondant aux nucleotides des positions 26977 a 28218 (SEQ ID NO :20), en refe- 
10 rence k la sequence Genbank n° d'acces AY2741 19.3, 

- le plasmide denomme SARS-N, compris dans la souche bacte- 
rienne deposee sous le n° 1-3048, le 5 juin 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
contient TADNc codant pour la proteine N de la souche de SARS-CoV issue du 

15 prelevement repertorie sous le n° 031589, telle que definie ci-dessus, laquelle 
sequence correspondant aux nucleotides des positions 28054 a 29430 (SEQ ID 
NO :38), en reference a la sequence Genbank n° d'acces AY2741 19.3, 

- le plasmide denomme SARS-5'NC, compris dans la souche bacte- 
rienne deposee sous le n° I- 3124, le 7 novembre 2003, aupres de la Collection 

20 Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15 ; il contient PADNc correspondant a Pextremite 5'non codante du genome 
de la souche de SARS-CoV issue du prelevement repertorie sous le n° 031589, telle 
que definie ci-dessus, laquelle sequence correspondant aux nucleotides des positions 1 
a 204 (SEQ ID NO :39), en reference a la sequence Genbank n° d'acces AY2741 19.3, 

25 - le plasmide denomme SARS-3'NC, compris dans la souche bacte- 

rienne deposSe sous le n° 1-3123 le 7 novembre 2003, aupres de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15. ; il contient la sequence d'ADNc correspondant a Fextremite 3'non codante 
du genome de la souche de SARS-CoV issue du prelevement repertorie sous le n° 

30 031589, telle que d6finie ci-dessus, laquelle sequence correspondant a celle situee 
entre le nucleotide en position 28933 a 29727 (SEQ ID NO :40), en reference a la 
sequence Genbank n° d'acces AY2741 193, se termine par une serie de nucleotides a., 
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- le plasmide ^expression denomme pIV2.3N, contenant un 
fragment d'ADNc codant pour une fusion C-terminale de la prot6ine N (SEQ ID NO : 
37) avec une etiquette polyhistidine, 

- le plasmide d'expression denomme pIV2.3Sc, contenant un 
fragment d'ADNc codant pour une fusion C-terminale du fragment correspondant aux 
positions 475 a 1 193 de la sequence en acides amines de la proteine S (SEQ ID NO : 
3) avec une etiquette polyhistidine, 

- le plasmide d'expression P IV2.3S L , contenant un fragment 
d'ADNc codant pour une fusion C-terminale du fragment correspondant aux positions 
14 a 1 193 de la sequence en acides amines de la proteine S (SEQ ID NO : 3) avec une 

etiquette polyhistidine, 

- le plasmide d'expression denomme pIV2.4N, contenant un 
fragment d'ADNc codant pour une fusion N-terminale de la proteine N (SEQ ID NO : 
3) avec une etiquette polyhistidine, 

- le plasmide d'expression denomme pIV2.4S c ou pIV2.4S,, 
contenant un insert codant pour une fusion N-terminale du fragment correspondant 
aux positions 475 a 1193 de la sequence en acides amines de la prot6ine S (SEQ ID 
NO : 3) avec une Etiquette polyhistidine, et 

- le plasmide d'expression denomme prV2.4S L contenant un 
20 fragment d'ADNc codant pour une fusion N-terminale du fragment correspondant aux 

positions 14 a 1 193 de la sequence en acides aminds de la proteine S (SEQ ID NO : 3) 
avec une etiquette polyhistidine. 

Selon une disposition avantageuse du plasmide d'expression tel que 
defini ci-dessus, il est compris dans une souche bacterienne qui a ete deposee sous le 
25 n° I- 3117, le 23 octobre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 1 5. 

Selon une autre disposition avantageuse du plasmide d'expression 
tel que d6fini ci-dessus, il est compris dans une souche bacterienne qui a ete deposee 
sous le n° I- 3118, le 23 octobre 2003, aupres de la Collection Nationale de Cultures 
30 de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 1 5. 

La presente invention a egalement pour objet une banque d'ADNc 
caracterisee en ce qu'elle comprend des fragments tels que defmis ci-dessus, en parti- 
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culier des fragments d'amplification ou des fragments de restriction, clones dans un 
vecteur recombinant, notamment un vecteur d'expression (banque d'expression). 

La presente invention a egalement pour objet des cellules, notam- 
ment des cellules procaiyotes, modifi^es par un vecteur recombinant tel que defini ci- 
5 dessus. 

Les vecteurs recombinants tels que d6finis ci-dessus et les cellules 
transformees par lesdits vecteurs depression sont avantageusement utilises pour la 
production des proteines et des peptides correspondants. Les banques d'expression 
derivees desdits vecteurs, ainsi que les cellules transformers par lesdites banques 

10 depression sont avantageusement utilisees pour identifier les epitopes immunogenes 
(epitopes B et T) des proteines du coronavirus associe au SRAS. 

La presente invention a egalement pour objet les proteines et les 
peptides purifiees ou isolees, caracterises en ce qu'ils sont cod<§s par le polynucleotide 
ou Tun de ses fragments tels que definis ci-dessus. 

15 Selon un mode de realisation avantageux de l'invention, ladite 

proteine est s61ectionnee dans le groupe constitue par : 

- la proteine S de sequence SEQ ID NO :3 

- la proteine E de sequence SEQ ID NO : 14 

- la proteine M de sequence SEQ ID NO : 1 7 
20 - la proline N de sequence SEQ ID NO : 37 

- les prolines codees par les ORFs : ORFla, ORFlb, ORF3, ORF4 
et ORF7 a ORF1 1, ORF13 et ORP14 de sequence respectivement, SEQ ID NO ;74, 
75, 10, 12, 22, 24, 26, 28, 30, 33 et 35. 

Selon un mode de realisation avantageux de l'invention, ledit 
25 peptide est selectionne dans le groupe constitue par : 

a) les peptides correspondant aux positions 14 a 1 193 et 475 a 1 193 
de la sequence en acides amines de la proteine S, 

b) les peptides correspondant aux positions 2 a 14 (SEQ ID NO : 69) 
et 100 a 221 dela sequence en acides amines de la proteine M ; ces peptides corres- 

30 pondent respectivement a P ectodomaine et a Tendodomaine de la proteine M, et 

c) les peptides correspondant aux positions 1 a 12 (SEQ ID NO : 70) 
et 53 a 76 (SEQ ID NO : 71) de la sequence en acides amines de la proteine E ; ces 
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peptides correspondent respectivement a Pectodomaine et a Textremite C-terminale de 
la proteine E, et 

d) les peptides de 5 a 50 acides amines consecutifs, de preference de 
10 a 30 acides amines, inclus ou chevauchant partiellement ou totalement la sequence 
5 des peptides tels que definis en a), b) ou c). 

La prSsente invention a egalement pour objet un peptide caracterise 
en ce qu'il pr&ente une sequence de 7 a 50 acides amines incluant un residu d'acide 
amin6 s61ectionne dans le groupe constitue par : 

- F alanine situee en position 2552 de la sequence en acides amines 
10 de la proteine codee par TORF1 a. 

- la serine situSe en position 577 de la sequence en acides amines de 
la proteine S de la souche de SARS-CoV telle que definie ci-dessus, 

- la glycine en position 11 de la sequence en acides amines de la 
proteine codee par TORF3 de la souche de SARS-CoV telle que definie ci-dessus, 

15 - la serine en position 154 de la sequence en acides amines de la 

proteine M de la souche de SARS-CoV telle que definie ci-dessus. 

La presente invention a egalement pour objet un anticorps ou un 
fragment d'anticorps polyclonal ou monoclonal, susceptible d'etre obtenu par 
immunisation d'un animal avec un vecteur recombinant tel que d6fini ci-dessus, une 
20 banque d'ADNc telle que definie ci-dessus ou bien une proteine ou un peptide tels que 
d£finis ci-dessus, caracterise en ce qu'il se lie avec Tune au moins des proteines 
codees par le SARS-CoV telles que definies ci-dessus. 

L'invention englobe les anticorps polyclonaux, les anticorps mono- 
clonaux, les anticorps chimeriques tels que les anticorps humanises, ainsi que leurs 
25 fragments (Fab, Fv, scFv). 

Au sens de la pr6sente invention, on entend par anticorps 
chimerique, relativement a un anticorps d'une espece animale parti culi ere ou d'une 
classe particuliere d'anticorps, un anticoips comprenant tout ou partie d'une chafne 
lourde et/ou d'une chatne legere d'un anticorps d'une autre esp&ce animale ou d'une 
30 autre classe d'anticorps. 

Au sens de la presente invention, on entend par anticorps humanise 
une immmunoglobuline humaine dans laquelle les residus des CDRs 
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(Complementary-Determining Regions) qui forment le site de liaison a Tantig&ne sont 
remplaces par ceux d'un anticorps monoclonal non-humain possedant la specificite, 
raffinite ou 1'activite recherchees. Par comparaison avec les anticorps non-humains, 
les anticorps humanises sont moins immunogenes et possedent une demi-vie prolon- 
5 gee chez THomme car ils ne possedent qu'une faible proportion de sequences non- 
humaines etant donne que la quasi-totalite des residus des regions FR (Framework) et 
de la region constante (Fc) de ces anticorps sont ceux d'une sequence consensus 
d'immunoglobulines humaines. 

La presente invention a egalement pour objet une puce a proteine, 
10 caracterisee en ce qu'elle comprend une proteine, un peptide ou bien un anticorps tels 
que definis ci-dessus. 

Les puces a proteine selon Pinvention sont preparees par les 
methodes classiques, connues en elles-memes. Parmi les supports appropries sur 
lesquels peuvent etre immobilises des proteines, on peut citer ceux en matiere 
1 5 plastique ou en verre, notamment sous la forme de microplaques. 

La presente invention a egalement pour objet des reactifs derives de 
la souche isolee de coronavirus associe au SRAS, issue du prelevement r6pertorie sous 
le n° 031589, utiles pour Tetude et le diagnostic de Finfection provoquee par un 
coronavirus associe au SRAS, lesquels reactifs sont selectionnes dans le groupe cons- 
20 tituepar : 

(a) une paire d'amorces, une sonde ou une puce a ADN telles que 
definies ci~dessus, 

(b) un vecteur recombinant ou une cellule modifiee tels que d6finis 

ci-dessus, 

25 (c) une souche isolee de coronavirus ou un polynucleotide tels que 

definis ci-dessus, 

(d) une proteine ou un peptide tel que defini ci-dessus, 

(e) un anticorps ou fragment d'anticorps tels que definis ci-dessus, et 

(f) une puce a proteine telle que definie ci-dessus. 

30 Ces differents reactifs sont prepares et utilises selon les techniques 

classiques de biologie moleculaire et d'immunologie, en suivant les protocoles 
standards tels que ceux dScrits dans Current Protocols in Molecular Biology 
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(Frederick M. AUSUBEL, 2000, Wiley and Son Inc., Library of Congress, USA), 
dans Current Protocols in Immunology (John E. Cologan, 2000, Wiley and Son Inc. 
Library of Congress, USA) et dans Antibodies : A Laboratory Manual (E. Howell and 
D Lane, Cold Spring Harbor Laboratory, 1988). 

5 Les fragments d'acide nucleique selon 1'invention sont prepares et 

utilises selon les techniques classiques telles que definies ci-dessus. Les peptides et les 
prolines selon l'invention sont prepares par les techniques d'ADN recombinant, 
connues de rHomme du metier, notamment a l'aide des vecteurs recombinants tels 
que definis ci-dessus. Alternativement, les peptides selon l'invention peuvent etre 

10 prepares par les techniques classiques de synthese en phase solide ou liquide, connues 

de rHomme du metier. 

Les anticorps polyclonaux sont prepares par immunisation d'un 
animal approprie avec une proteine ou un peptide tels que definis ci-dessus, eventuel- 
lement cou P 16 a la KLH ou a l'albumine et/ou associe a un adjuvant appropri6 tel que 
15 l'adjuvant de Freund (compiet ou incomplet) ou llrydroxyde d'alumine ; apres obten- 
tion d'un titre en anticorps satisfaisant, les anticorps sont recoltes par prelevement du 
serum des animaux immunises et enrichis en IgG par precipitation, selon les 
techniques classiques, puis les IgG specifiques des proteines du SARS-CoV sont 
eventuellement purifiees par chromatographie d'affinitd sur une colonne appropriee 
20 sur laquelle sont fixes ledit peptide ou ladite proteine, tels que definis ci-dessus, de 
facon a obtenir une preparation d'IgG monospecifiques. 

Les anticorps monoclonaux sont produits a partir d'hybridomes 
obtenus par fusion de lymphocytes B d'un animal immunise^ par une proteine ou un 
peptide tels que definis ci-dessus avec des myelomes, selon la technique de Kohler et 
25 Milstein (Nature, 1975, 256, 495-497) ; les hybridomes sont cultives in vitro, notam- 
ment dans des fermenteurs ou produits in vivo, sous forme d'ascite ; alternativement 
lesdits anticorps monoclonaux sont produits par genie genetique comme decrit dans le 

brevet americain US 4,816,567. 

Les anticorps humanises sont produits par des methodes generales 
30 comme celles decrites dans la Demande Internationale WO 98/45332. 

Les fragments d'anticorps sont produits a partir des regions V H et 
V L donees, a partir des ARNm d'hybridomes ou de lymphocytes spldniques d'une 
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souris immunisee ; par exemple, les fragments Fv, scFv ou Fab sont exprimSs a la 
surface de phages filamenteux selon la technique de Winter et Milstein (Nature, 1991, 
349, 293-299) ; apres plusieurs etapes de selection, les fragments d'anticorps 
specifiques de l'antigene sont isoles et exprimes dans un systeme ^expression appro- 
5 prie, par les techniques classiques de clonage et d'expression d'ADN recombinant. 

Les anticorps ou leur fragments tels que definis ci-dessus, sont 
. purifies par les techniques classiques connues de l'Horame du metier, telles que la 
chromatographic d'affinite. 

La presente invention a en outre pour objet 1'utilisation d'un produit 
10 selectionne dans le groupe constitue par : une paire d'amorces, une sonde, une puce a 
ADN, un vecteur recombinant, une cellule modifi6e, une souche isol6e de coronavirus, 
un polynucleotide, une proteine ou un peptide, un anticorps ou un fragment 
d'anticorps, et une puce a proteine tels que dSfinis ci-dessus, pour la preparation d'un 
reactif de detection et eventuellement de genotypage/s6rotypage, d'un coronavirus 
15 associ£ au SRAS. 

Les proteines et les peptides selon l'invention, qui sont aptes a etre 
reconnus et/ou a induire la production d'anticorps specifiques du coronavirus associe 
au SRAS, sont utiles pour le diagnostic de l'infection par un tel coronavirus ; 
Tinfection est detectee, par une technique appropriee- notamment EIA, ELISA, RIA, 

20 immunofluorescence-, a partir d'un echantillon biologique preleve chez un individu 
susceptible d'etre infecte. 

Selon une disposition avantageuse de ladite utilisation, lesdites 
proteines sont selectionn6es dans le groupe constitue par les proteines S, E, M et/ou N 
et les peptides tels que definis ci-dessus. 

25 Les prolines S, E, M et/ou N et les peptides derives de ces proteines 

tels que definis ci-dessus, par exemple la proline N, sont utilisees pour le diagnostic 
indirect d'une infection a coronavirus associe au SRAS (diagnostic serologique ; 
detection d'anticorps specifiques du SARS-CoV), notamment par une methode 
immunoenzymatique (ELISA). 

30 Les anticorps et les fragments d'anticorps selon l'invention, 

notamment ceux diriges contre les prot&nes S, E, M et/ou N et les peptides d&riv6s 
tels que definis ci-dessus, sont utiles pour le diagnostic direct d'une infection a coro- 
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navirus associe au SRAS ; la detection de prot6ine(s) du SARS-CoV est r6alisee par 
une technique appropriee, notamment EIA, ELISA, RIA, immunofluorescence & partir 
d'un echantillon biologique preleve chez un individu susceptible d'etre infecte. 

La pr6sente invention a egalement pour objet une m6thode de detec- 
5 tion d'un coronavirus associe au SRAS, a partir d'un echantillon biologique, laquelle 
m6thode est caracterisee en ce qu'elle comprend au moins : 

(a) la mise en contact dudit echantillon biologique avec au moins un 
anticorps ou un fragment d'anticorps, une proteine, un peptide ou bien une puce ou un 
filtre a proteine ou k peptide tels que definis ci-dessus, et 
10 (b) la revelation par tout moyen approprie des complexes antigene- 

anticorps formes en (a), par exemple par EIA, ELISA, RIA, ou par immunofluores- 
cence. 

Selon un mode de mise en ceuvre avantageux dudit proced6 l'etape 

(a) comprend : 

15 (ai) la mise en contact dudit echantillon biologique avec au moins un 

premier anticorps ou un fragment d'anticorps qui est fixe sur un support approprie, 
notamment une microplaque, 

(a2) le lavage de la phase solide, et 

(a3) 1' addition d'au moins un second anticoips ou un fragment 
20 d'anticorps, diff&rent du premier, ledit anticorps ou fragment d'anticorps 6tant 
eventuellement marqu6 de fa9on appropriee. 

Ce procede qui permet de capturer les particules virales presentes 
dans l'6chantillon biologique est egalement denomme proced6 d'immunocapture. 

Par exemple : 

25 - l'etape (ai) est realisee avec au moins un premier anticoips mono- 

clonal ou polyclonal ou un fragment de ceux-ci, dirige contre la proteine S, M, et/ou 
E, et/ou un peptide correspondant a Tectodomaine de l'une de ces prolines (peptides 
M2-14ouEM2) 

- l'etape (a*) est realisee avec au moins un anticorps ou un fragment 
30 d'anticorps dirige contre un autre epitope de la meme proteine ou de preference contre 
une autre proteine, de maniere pr6f6ree contre une proteine interne telle que la nucleo- 
proteine N ou I'endodomaine de la proline E ou M, de maniere encore plus preferee 
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il s'agit d'anticorps on de fragments d'anticorps diriges contre la proteine N qui est 
tres abondante dans la particule virale; lorsqu'un anticorps ou un fragment 
d'anticorps dirige contre une proteine interne (N) ou contre Pendodomaine des 
proteines E ou M est utilise, le dit anticorps est incube en presence de detergent, 
5 comme le Tween 20 par exemple, a des concentrations de Tordre de 0,1 %. 

- PStape (b) de revelation des complexes antigene-anticorps formes 
est realisee, soit directement a Paide d'un second anticorps marque par exemple avec 
de la biotine ou une enzyme appropriee telle que la peroxydase ou la phosphatase 
alcaline, soit indirectement a Paide d'un serum anti-immunoglobulines marqu6 
10 comme ci-dessus. Les complexes ainsi formes sont rdveles a Paide d'un substrat 
appropri6. 

La presente invention a en outre pour objet un kit de detection d'un 
coronavirus associS au SRAS, caracterise en ce qu'il comprend au moins un reactif 
selectionne dans le groupe constitue par : une paire d'amorces, une sonde, une puce a 
15 ADN ou a ARN, un vecteur recombinant, une cellule modifiee, une souche isolee de 
coronavirus, un polynucleotide, une proteine ou un peptide, un anticorps, et une puce k 
proteine tels que definis ci-dessus. 

La presente invention a en outre pour objet, une composition 
immunogene, caracterisee en ce qu'elle comprend au moins un produit selection^ 
20 dans le groupe constitue par : 

a) une proteine ou un peptide tels que d<§finis ci-dessus, 

b) un polynucleotide de type ADN ou ARN ou Tun de ses fragments 
repr6sentatifs tels que definis ci-dessus, de sequence choisie paimi : 

(i) la sequence SEQ ID NO : 1 ou son equivalent ARN 
25 00 la sequence hybridant dans des conditions de forte stringence 

avec la sequence SEQ ID NO : 1 , 

(iii) la sequence compl6mentaire de la sequence SEQ ID NO : 1 ou 
de la sequence hybridant dans des conditions de forte stringence avec la sequence 
SEQ ID NO: 1, 

30 Ov) la sequence nucleotidique d'un fragment representatif du poly- 

nucleotide tel que defini en (i), (ii) ou (iii), 

(v) la sequence telle que definie en (i), (ii), (iii) ou (iv), modiftee, et 
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c) un vecteur d'expression recombinant comprenant un 

polynucldotide tel que defini en b), et 

d) nne banque d'ADNc telle que definie ci-dessus, 

ladite composition immunogene etant capable d'induire une immunite humorale ou 
cellulaire protectrice specifique du coronavirus associe au SRAS, notamment la 
production d'un anticotps dirige centre un epitope specifique du coronavirus associ6 
au SRAS. 

Les proteines et les peptides tels que definis ci-dessus, notamment 
les proteines S, M, E et/ou N et les peptides derives, ainsi que les molecules d'acide 
nucleique (ADN ou ARN) codant lesdites proteines ou lesdits peptides, sent de bons 
candidats vaccin et peuvent etre utilisees dans des compositions immunogenes pour la 
production d'un vaccin contre le coronavirus associe au SRAS. 

Selon un mode de realisation avantageux des compositions selon 
Invention, elles contiennent en outre, au moins un vehicule pharmaceutiquement 
acceptable et eventuellement des substances porteuses et/ou des adjuvants. 

Les vehicules pharmaceutiquement acceptables, les substances 
porteuses et les adjuvants sont ceux classiquement utilises. 

Le S adjuvants sont avantageusement choisis dans le groupe constitu6 
par des emulsions huileuses, de la saponine, des substances minerales, des extraits 
bacteriens, de l'hydroxyde d'alumine et le squalene. 

Les substances porteuses sont avantageusement selectionn6es dans 
le groupe constitue par des liposomes unilamellaires, des liposomes multilamellaires, 
des micelles de saponine ou des microspheres solides de nature saccharidique ou 
aurifere. 

Les compositions selon l'invention, sont administrees par voie 
generale, notamment intramusculaire ou sous-cutanee ou bien par voie locale notam- 
ment nasale (a6rosol). 

La presente invention a egalement pour objet l'utilisation d'une 
proteine ou d'un peptide isole ou purifi6 presentant une sequence selectionnee dans le 
) groupe constitue par les sequences SEQ ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 
33 35 37, 69, 70, 71, 74 et 75 pour former un complexe immun avec un anticorps 
dirig6 specifiquement contre un epitope du coronavirus associ6 au SRAS. 
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La pr6sente invention a 6galement pour objet un complexe immun 
forme d'une proteine ou d'un peptide isole ou purifie presentant une sequence selec- 
tionn6e dans le groupe constitue par les sequences SEQ ID NO : 3, 10, 12, 14, 17, 22, 
24, 26, 28, 30, 33, 35, 37, 69, 70, 71, 74 et 75, et d'un anticorps dirige specifiquement 
5 contre un epitope du coronavirus associe au SRAS. 

La presente invention a 6galement pour objet Tutilisation d'une 
proteine ou d'un peptide isole ou puriffe presentant une sequence selectionn6e dans Ie 
groupe constitue par les sequences SEQ ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 
33, 35, 37, 69, 70, 71, 74 et 75 pour induire la production d'un anticorps capable de 
10 reconnaitre specifiquement un epitope du coronavirus associe au SRAS. ' 

La presente invention a egalement pour objet Futilisation d'un poly- 
nucleotide isole ou purifie presentant une sequence selectionnee dans Ie groupe 
constitue par les sequences SEQ ID NO : 1, 2, 4, 7, 8, 13, 15, 16, 18, 19, 20, 31, 36 et 
38 pour induire la production d'un anticorps dirige contre la proteine codee par ledit 
15 polynucleotide et capable de reconnaitre specifiquement un epitope du coronavirus 
associe au SRAS 

Outre les dispositions qui precedent, l'invention comprend encore 
d'autres dispositions, qui ressortiront de la description qui va suivre, qui se refere a 
des exemples de mise en oeuvre du polynucleotide representant le genome de la 
20 souche de SARS-CoV issue du pr<§levement repertorie sous le numero 031589, et des 
fragments d'ADNc derives objets de la pr6sente invention, ainsi qu'au Tableau I 
presentant la liste des sequences : 



Tableau I : Liste des sequences 



numero 
^identification 


Sequence 


Position de 
I'ADNc en 

reference a 
Genbank 

AY274119.3 


Numero de 
depot a la CNCM 

du plasmide 
correspondant 


SEQ ID NO : 1 


genome de la 
souche issue du 
prelevement 
031589 






SEQ ID NO : 2 


ORF-S* 


21406-25348 




SEQ ID NO : 3 


Proteine S 






SEQ ID NO : 4 


ORF-S** 


21406-25348 


I-3059 


SEQ ID NO : 5 


fragment Sa 


21406-23454 


I-3020 
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SEQ ID NO : 51 


Fragment L9 


14745-16646 




SEQ ID NO : 52 


Fragment L1 0 


16514-18590 


- 


SEQ ID NO : 53 


Fragment L1 1 


18500-20602 




SEQ ID NO : 54 


Fragment L12 


20319-22224 


mm 


SEQ ID NO : 55 


Amorce N sens 






SEQ ID NO : 56 


Amorce N 
antlsens 


: 




SEQ ID NO : 57 


Amorce S c sens 


— — : 




SEQ ID NO : 58 


Amorce Sl sens 


- 




SEQ ID NO : 59 


Amorce Sc e t Sl 
antisens 






SEQ ID NO : 60 


Amorce sens 
serie 1 


28507-28522 


- 


SEQ ID NO : 61 


Amorce antisens 
serie 1 


28774-28759 




SEQ ID NO : 62 


Amorce sens 
serie 2 


28375-28390 




SEQ ID NO : 63 


Amorce antisens 
serie 2 


28702-28687 


- 


SEQ ID NO : 64 


Sonde 1 /serie 1 


28561-28586 




SEQ ID NO : 65 


Sonde 2/serie 1 


28588-28608 




SEQ ID NO : 66 


Sonde 1 /serie 2 


28541-28563 




SEQ ID NO : 67 


Sonde 2/serie 2 


28565-28589 


- 


SEQ ID NO : 68 


Amorce ancre 
14T 






SEQ ID NO : 69 


Peptide M2-14 






SEQ ID NO : 70 


Peptide E1-12 






SEQ ID NO : 71 


Peptide E53-76 






SEQ ID NO : 72 


5'non-codante* 


1-204 




SEQ ID NO : 73 


3'non-codante* 


28933-29727 




SEQ ID NO : 74 


Proteine ORF1a 






SEQ ID NO : 75 


Proteine ORF1b 






SEQ ID NO:76-139 


Amorces 





* produit d' amplification PCR (amplicon) 
** insert clone dans le plasmide depose a la CNCM 
ainsi qu'aux dessins annexes dans lesquels : 



- la figure 1 illustre Panalyse par Western-blot de l'expression in 
5 vitro des proteines recombinantes N, Sc et Sl a partir des vecteurs d'expression 

pIVEX. Piste 1 : pIV2.3N. Piste 2 : pIV2.3Sc. Piste 3 : pTV2.3S L . Piste 4 : pIV2.4K 
Piste 5 : pIV2.4Si ou pIV2.4S c . Piste 6 : pIV2.4S L . L'expression de la prot&ne GFP 
exprimee a partir du raeme vecteur est utilisee comme controle. 

- la figure 2 illustre Tanalyse par electrophorese en gel de 
10 polyacrylamide en conditions denaturantes (SDS-PAGE) et coloration au bleu de 
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Coomassie, de I'expression in vivo de la protSne N a partir des vecteurs depression 
plVEX. La souche VE.coli BL21(DE3)pDIA17 transformee par les vecteurs pIVEX 
recombinants est cultivee a 30°C dans du milieu LB, en presence ou en 1'absence 
d'inducteur (IPTG ImM). Piste 1 : pIV2.3N Piste 2 : pIV2.4N. 

5 - la figure 3 iUustre l'analyse par 61ectrophorese en gel de 

polyacrylamide en conditions denaturantes (SDS-PAGE) et coloration au bleu de 
Coomassie, de I'expression in vivo des polypeptides S L et S c a partir des vecteurs 
^expression pIVEX. La souche VE.coli BL21(DE3)pDIA17 transformee par les 
vecteurs pIVEX recombinants est cultivee a 30°C dans du milieu LB, en presence ou 

10 en l'absence d'inducteur (IPTG ImM). Piste 1 : P IV2.3Sc Piste 2 : pIV2.3S L . Piste 3 : 

pIV2.4Si Piste 4 : prv*2.4S L - 

- la figure 4 illustre l'activite antigenique des proteines N, S L et S c 
recombinantes produites dans la souche E coli BL21(DE3)pDIA17 transformee par 
les vecteurs pIVEX recombinants. A : electrophorese (SDS-PAGE) des lysats bacte- 

15 riens.B et C : Western-blot avec les serums, provenant d'un meme patient infect6 par 
le SARS-CoV, preleves respectivement 8 jours (B : serum M12) et 29 jours-(C : 
serum M13) apres le debut des symptomes du SRAS. Piste 1 : "pIV2.3N. Piste 2 : 
pIV2.4N. Piste 3 : pIV2.3Sc. Piste 4 : pIV2.4 S,. Piste 5 : pIV2.3S L . Piste 6 : pTV2.4S L 

- la figure 5 illustre la purification sur colonne Ni-NTA agarose de la 
20 proteine N recombinante produite dans la souche E. coli BL21(DE3)pDIA17 a partir 

du vecteur pIV2.3N. Piste 1 : Extrait bacterien total. Piste 2 : Extrait soluble. Piste 3 : 
Extrait insoluble. Piste 4 : Extrait depose sur la colonne Ni-NTA. Piste 5 : proteines 
non-retenues. Piste 6 : Fractions du pic 1 . Piste 7 : Fractions du pic 2. 

- la figure 6 illustre la purification de la proteine S c recombinante a 
25 partir des corps d'inclusions produits dans la souche E. coli BL21(DE3)pDIA17 trans- 

formde par le PIV2.4SJ.A. Traitement au Triton X-100 (2%) : Piste 1 : Extrait 
bacterien total. Piste 2 : Extrait soluble. Piste 3 : Extrait insoluble. Piste 4 : Sumageant 
apres traitement au Triton X-100 (2 %). Pistes 5 et 6 : Culot apres traitement au Triton 
X-100 (2 %).B : Traitement a l'uree 4M, 5M, 6M et 7M des extraits solubles et inso- 
30 lubles. 
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- la figure 7 represente rimmunoempreinte realisee a Paide d'un 
lysat de cellules infectees par le SARS-CoV et d'un s6rum de patient atteint de 
pneumopathie atypique. 

- la figure 8 represente des immunoempreintes realisees a Faide 
5 d'un lysat de cellules infectees par le SARS-CoV et d'immunserums de lapins speci- 

fiques de la nucleoproteine N (A) et de la proteine de spicule S (B). I.S. : s6rum 
immun. p.i. : serum pr6-immun. L'immunserum anti-N a ete utilise au 1/50000 et 
1'immun serum anti-S au 1/10000. 

- la figure 9 illustre la rSactivite en ELISA des serums polyclonaux 
10 monospecifiques de lapin dirig6s contre la prot6ine N ou le fragment court de la 

proteine S (Sc), vis-a-vis des proteines recombinantes correspondantes utilisees pour 
IMmmunisation. A : lapins P13097, P13081, et P13031 immunises avec la proteine N 
recombinante purifie. B: lapins PI 1135, PI 3042, et P14001 immunises avec une 
preparation de corps d' inclusions correspondants au fragment court de la proteine S 
15 (Sc). I.S. : serum immun. p.i. : serum pr6-immun. 

- Ia figure 10 illustre la r6activite en ELISA de la proteine N 
recombinante purifiee, vis-a-vis de serum de patients atteints de pneumonie atypique 
causae par le SARS-CoV. Figure 10a : plaques ELISA prepares avec la proteine N a la 
concentration de 4 fig/ml et 2 jig/ml. Figure 10b : plaque ELISA preparee avec la 

20 proteine N a la concentration de 1 fxg/ml. Les serums designes A, B, D, E, F, G, H 
correspondent a ceux du Tableau IV. 

- Ia figure 11 illustre F amplification par RT-PCR de quantites 
decroissantes d'ARN synthetique du gene N du SARS-CoV (10 7 a 1 copie), a Faide 
des couples d r amorces n° 1 (N/+/28507,N/-/28774) (A) et n° 2 (N/+/28375,N/-/28702) 

25 (B). T : amplification realis6e en Tabsence dARN. MW : marqueur dADN. 

- la figure 12 illustre F amplification par RT-PCR en temps reel 
dARN synthetique du gene N du SARS-CoV : des quantites decroissantes dARN 
synthetique en repliquat (repli. ; pistes 16 a 29) ainsi que de PARN viral dilue au 
1/20x1 0* 4 (piste 32) ont ete amplifies par RT-PCR en temps reel a l f aide du kit "Light 
30 Cycler RNA Amplification Kit Hybridization Probes" et des couples d^orces et de 
sondes de la serie n° 2, dans les conditions d6crites a Fexemple 7. 
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- la figurel3 (figure 13.1 a 13.70) represente la carte de restriction 
de la sequence SEQ ID NO : 1 correspondant a 1' equivalent ADN du genome de la 
souche de SARS-CoV issue du prelevement repertorie sous le numero 031589. 

II doit etre bien entendu, toutefois, que ces exemples sont donnas 
5 uniquement a titre d* illustration de Pobjet de Finvention, dont ils ne constituent en 
aucune maniere une limitation. 

Exemple 1 : Clonage et sequen^age du genome de la souche de SARS-CoV issue 
du prelevement repertorie sous le numero 031589 

L'ARN de la souche de SARS-CoV a ete extrait k partir du prele- 

10 vement de lavage bronchoalveolaire repertorie sous le numero 031 589, effectu6 sur un 
patient de ThSpital fran9ais de Hanoi (Vietnam) atteint de SRAS. 

L'ARN isole a 6t& utilise comme matrice pour amplifier les ADNc 
correspondant aux diflferents cadres ouverts de lecture du genome (ORF la, ORFlb, 
ORF-S, ORF-E, ORF-M, ORF-N (incluant les ORF-13 et ORF- 14), ORF3, ORF4, 

15 ORF7 a ORF 11), et aux extremites 5' et 3 5 non-codantes. Les sequences des amorces 
et des sondes utilisees pour Pamplification/detection out ete definies d'apres la 
sequence nucleotidique disponible du SARS-CoV. 

Dans ce qui suit les amorces et les sondes sont identifiees par : la 
lettre S, suivie d'une lettre qui indique la region correspondante du genome (L pour 

20 Fextremite 5'incluant ORF1 a et ORFlb ; S, M et N pour les ORF-S, ORF-M, ORF-N, 
SE et MN pour les regions intergeniques correspondantes), puis eventuellement de Fn, 
Rn, avec n inclus entre 1 et 6 correspondant aux amorces utilises pour la PCR nichSe 
ou imbriqu6e (paire Fl + Rl pour la premiere amplification, paire F2 + R2 pour la 
deuxieme amplification, etc.), puis de /+/ ou /-/ correspondant a une amorce sens ou 

25 antisens et enfin des positions des amorces en r&fcrence a la s6quence Genbank 
AY27411.3 ; pour les amorces S et N sens et antisens et les autres amorces sens 
uniquement, lorsqu'une seule position est indiquee elle correspond a celle de 
Pextremite 5' d'une sonde ou d'une amorce d'environ 20 bases ; pour les amorces 
antisens autres que les amorces S et N, lorsqu'une seule position est indiquee elle 

30 correspond a celle de Textremit6 3* d'une sonde ou d'une amorce d'environ 20 bases. 

Les produits d' amplifications ainsi g6ner6s ont et6 sequences a 
Paide d'amorces sp6cifiques afin de determiner la sequence complete du g&iome de la 
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souche de SARS-CoV issue du prelevement repertoriS sous le numSro 031589. Ces 
produits d'amplification, a l'exception de ceux correspondent aux ORFla et ORFlb, 
ont ensuite ete clones dans des vecteurs d'expression afin de produire les proteines 
virales correspond antes et les anticorps diriges contre ces proteines, notamment par 
5 immunisation k base d' ADN. 

1. Extraction des ARN 

Les ARN ont ete extraits a Faide du kit QIamp viral RNA extraction 
mini (QIAGEN) en suivant les recommandations du fabricant. De maniere plus 
precise : 140 ^il du prelevement et 560 fil de tampon AVL ont et6 melanges vigoureu- 

10 sement pendant 15 secondes, incubes 10 min a temperature ambiante puis centrifuges 
brievement a vitesse maximale. 560 |*1 d'ethanol a 100% ont ete ajoutes au surnageant 
et le melange ainsi obtenu a et6 agit6 tres vigoureusement pendant 15 sec. 630 fil du 
melange ont ensuite ete deposes sur la colonne. 

La colonne a 6te placee sur un tube de 2 ml, centrifugee 1 min a 

15 8000 rpm, puis le reste du melange precedent a ete depose sur la meme colonne, 
centrifuge a nouveau, 1 min a 8000 rpm et la colonne a ete transferee sur un tube de 2 
ml propre. Ensuite, 500 \x\ de tampon AW1 ont ete ajoutes sur la colonne, puis la 
colonne a ete centrifugee 1 min a 8000 rpm et 1'eluat a ete elimine. 500 p.1 de tampon 
AW2 ont ete ajoutes sur la colonne qui a ensuite ete centrifugee 3 min a 14000 rpm et 

20 transf&r6e sur un tube de 1,5 ml. Enfin, 60 ^il de tampon AVE ont ete ajoutes sur la 
colonne qui a et6 incubee 1 a 2 min a temperature ambiante puis centrifugee 1 min a 
8000 rpm. L'eluat correspondant a TARN purifie a 6te r6cupere et congele a -20°C. 

2. Amplification, sequencage et clonage des ADNc 
2.1) ADNc codant pour la proteine S 

25 Les ARN extraits a partir du prelevement ont et6 soumis a une trans- 

cription inverse a Paide d'oligonucleotides hexameriques de sequence aleatoire 
(pdN6), afin de produire des fragments d'ADNc. 

La sequence codant pour la glycoproteine S du SARS-CoV a ete 
amplifiee sovis la forme de deux fragments d'ADN chevauchants : fragment 5* 

30 (SRAS-Sa, SEQ ID NO:5) et fragment 3'(SRAS-Sb, SEQ ID NO:6), en r&ilisant deux 
amplifications successives a Taide d'amorces imbriqu6es. Les amplicons ainsi obtenus 
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ont et6 sequences, clones dans le vecteur plasmidique PCR 2.1-TOPO™ (IN 
VITROGEN), puis la sequence des ADNc clones a ete determinee. 
a )clonage et sequencage des fragments Sa et Sb 
ai) syn&ese de FADNc 
5 Le melange reactionnel contenant : ARN (5 , H2O ppi (3,5 ^1), 

tampon de transcriptase inverseSX (4 jxl,), dNTP 5 mM (2 fil), pdN6 100 ug/ml (4 jal), 
RNasin 40 UI/ul (0,5 jxl) et transcriptase inverse AMV-RT, 10 LTC/ul, PROMEGA 
(l^il) a 6te incube dans un thermocycleur dans les conditions suivantes : 45 min a 
42°C, 15 min k 55°C, 5 min k 95°C, puis 1' ADNc obtenu a 6t€ maintenu a +4°C. 

10 a2) pr^iCTe.^plificati.^^^ 

Les extremity 5' et 3' du g&ne S ont ete amplifiees respectivement 
avec les paires d'amorces S/F1/+/ 21350-21372 et S/Rl/-/ 23518-23498, S/F3/+/ 
23258-23277 et S/R3/-/253 82-253 63. Le melange reactionnel de 50 jal contenant : 
ADNc (2 amorces 50 piM (0,5 jil), tampon 10 X (5 fil), dNTP 5 mM (2 jil), Taq 

15 Expand High Fidelity, Roche (0,75 ^1) et H 2 0 (39, 75 jil) a et6 amplifie dans un 
thermocycleur, dans les conditions suivantes : une etape initiale de denaturation a 
94°C pendant 2 min a ete suivie de 40 cycles comprenant : une etape de denaturation a 
94°C pendant 30 sec, une etape d'hybridation a 55°C pendant 30 sec puis une 6tape 
d'elongation a 72°C pendant 2 min 30 sec, avec 10 sec d'elongation supplemental a 

20 chaque cycle, puis d'une etape finale d'elongation a 72°C pendant 5 min. 
a3> deugd&rn 

Les produits de la premiere amplification PCR (amplicons 5 7 et 3') 
ont subi une seconde etape d' amplification PCR (PCR nichee) dans des conditions 
identiques k celles de la premiere amplification, avec les paires d'amorces 

25 S/F2/+/21406-21426 et S/R2/-/23454-2343S, et S/F4/+/23322-23341 et S/R4A/25348- 
25329, respectivement pour Pamplicon 5' et Tamplicon 3\ 
a4).cjpnaseets^ 

Les amplicons Sa (extremite 5 7 ) et Sb (extr&nite 3') ainsi obtenus ont 
6te purifies a l'aide du kit QIAquick PCR purification (QIAGEN), en suivant les 

30 recommandations du fabricant, puis ils ont ete clones dans le vecteur PCR2.1-TOPO 
(kit Invitrogen), pour donner les plasmides denommes SRAS-S1 et SRAS-S2. 
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L'ADN des clones Sa et Sb a 6te isole puis Tinsert correspondant a 
ete sequence a Taide du Kit Big Dye, Applied Biosystem® et des amorces univer- 
selles Ml 3 forward et Ml 3 reverse, ainsi que des amorces: S/S/+/21867, 
S/S/+/22353, S/S/+/22811, S/S/+/23754, S/S/+/24207, S/S/+/24699, S/S/+/24348, 
5 S/S/-/24209, S/S/-/23630, S/SA/23038, S/S/-/22454, S/S/-/21815, S/S/-/24784, 
S/S/+/21556, S/S/+/23130 et S/S/+/24465, en suivant les instructions du fabricant ; les 
sequences des fragments Sa et Sb ainsi obtenues correspondent aux sequences SEQ ID 
NO :5 et SEQ ID NO :6 dans la liste de s6quences jointe en annexe. 

Le plasmide, d&iomme SARS-S1 a 6te depose sous le n° 1-3020, le 

10 12 mai 2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 
rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient un fragment 5' de la 
sequence du gene S de la souche de SARS-CoV issue du prelevement repertory sous 
le n° 031589, telle que d£finie ci-dessus, lequel fragment denomme Sa correspondant 
aux nucleotides des positions 21406 a 23454 (SEQ ID NO :5), en reference a la 

1 5 sequence Genbank AY2741 1 9.3 Tor2. 

Le plasmide, denomme TOP10F'-SARS-S2 a ete depose sous le n° 
1-3019, le 12 mai 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient un 
fragment 3'de la sequence du gene S de la souche de SARS-CoV issue du preleve- 

20 ment repertorie sous le n° 031589, telle que definie ci-dessus, lequel fragment 
denomm6 Sb correspondant aux nucleotides des positions 23322 a 25348 (SEQ ID 
NO : 6), en reference k la sequence Genbank n° d'acces AY2741 19.3. 
b ) clonage et s&mencage de TADNc complet (clone SRAS-S de 4 kb) 

L'ADNc S complet a ete obtenu a partir des clones SARS-S1 et 

25 SARS-S2 precites, de la fa9on suivante : 

1) une reaction d'amplification PCR a ete realisee sur un clone 
SARS-S2 en presence de F amorce S/R4/-/25348-25329 prScitee et de l>amorce. 
S/S/+/24696-24715: un amplicon de 633 bp a 6te obtenu, 

2) une autre reaction d'amplification PCR a 6te r6alis6e sur un autre 
30 clone SARS-S2, en presence des amorces S/F4/+/23322-23341 precitee et S/S/- 

/24803-24784: un amplicon de 1481 pb a et6 obtenu, 
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La reaction <P amplification a ete realisee dans les conditions telles 
que definies ci-dessus pour F amplification des fragments Sa et Sb, a F exception que 
30 cycles d' amplifications comprenant une 6tape de denaturation a 94° C pendant 20 
sec et une 6tape d'elongation k 72° C pendant 2 min 30 sec ont ete effectu6s. 
5 3) les 2 amplicons (633 pb et 1481 pb) ont 6te purifies dans les 

conditions telles que definies ci-dessus pour les fragments Sa et Sb. 

4) une autre reaction d' amplification PCR a Faide des amorces 
S/F4/+/23322-23341 et S/R4/-/25348-25329 precitees, a ete realisee sur les amplicons 
purifies obtenus en 3). La reaction d' amplification a ete realisee dans les conditions 

10 telles que definies ci-dessus pour F amplification des fragments Sa et Sb, a F exception 
que 30 cycles d'amplifications ont ete effectues. 

L'amplicon de 2026 pb ainsi obtenu a ete purifie, clone dans le 
vecteur PCR2.I-TOPO puis sequence comme ci-dessus, a Faide des amorces telles 
que definies ci-dessus pour les fragments Sa et Sb. Le clone ainsi obtenu a ete 

1 5 denomme clone 3\ 

5) Le clone SARS-S1 precedemment obtenu et le clone 3 'ont et6 
digeres par EcoR I, les bandes d' environ 2kb ainsi obtenues ont 6te purifiees sur gel 
puis amplifiees par PCR avec les amorces S/F2/+/2 1406-2 1426 et S/R4/-/25348- 
25329 pr6citees. La reaction d' amplification a ete realisee dans les conditions telles 

20 que definies ci-dessus pour Famplification des fragments Sa et Sb, a F exception que 
30 cycles d'amplifications ont ete effectues. L'amplicon d'environ 4 kb a 6te purifie et 
sequence II a ensuite et6 clone dans le vecteur PCR2.1-TOPO pour donner ie 
plasmide, denomme SARS-S, et Finsert contenu dans ce plasmide a ete sequence 
comme ci-dessus, k Faide des amorces telles que d6finies ci-dessus pour les fragments 

25 Sa et Sb. Les sequences d'ADNc de Finsert et de Famplicon codant pour la proteine 
S, correspondent respectivement aux s6quences SEQ ID NO : 4 et SEQ ID NO : 2 
dans la liste de sequences jointe en annexe, elles codent pour la proline S (SEQ ID 
NO : 3). 

La sequence de Famplicon correspondant a FADNc codant pour la 
30 proteine S de la souche de SARS-CoV issue du prelevement n°031589 presente les 
deux mutations suivantes par rapport aux sequences correspondantes de respective- 
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ment les isolats Tor2 et Urbani, les positions des mutations etant indiquees en refe- 
rence a la sequence complete du genome de IMsolat Tor2 (Genbank AY2741 1 9.3) : 

- g/t en position 23220 ; le codon alanine (get) en position 577 de la 
sequence en acides amines de la prot&ne S de Tor2 est remplace par un codon serine 

5 (tct), 

- c/t en position 24872 : cette mutation ne modifie pas la sequence 
en acides amines de la proteine S, et 

Le plasmide, denomme SARS-S, a ete depose sous le n° 1-3059, le 
20 juin 2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 

10 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence d'ADNc codant 
pour la proteine S de la souche de SARS-CoV issue du prelevement repertorie sous le 
n° 031589, laquelle sequence correspondant aux nucleotides des positions 21406 a 
25348 (SEQ ID NO :4), en reference a la sequence Genbank AY2741 19.3. 
2.2) ADNc codant pour les proteines M et E 

15 Les ARN issus du prelevement 031589, extraits comme ci-dessus, 

ont ete soumis a une transcription inverse, associee, lors de la meme etape (kit Titan 
One Step RT-PCR®, Roche), a une reaction ^amplification par PCR, a 1'aide des 
couples d'amorces : 

- S/E/F1/+/26051 -26070 et S/E/R1/-/26455-26436 pour amplifier l'ORF-E, et 
20 - S/M/F1/+/26225-26244 et S/M/R1/-/271 48-27 129 pour amplifier l'ORF-M. 

Un premier melange reactionnel contenant : 8,6 jil d'H 2 Oppi, 1 \i\ de 
dNTP (5mM), 0,2 ^1 de chacune des amorces (50jaM), 1,25 jil de DTT (lOOmM) et 
0,25 \xl de RNAsin (40UI/^il) a ete combine avec un deuxieme melange reactionnel 
contenant : 1 jil d'ARN, 7 pi d'H 2 Oppi, 5 fxl de tampon de RT-PCR 5X et 0,5 jul de 
25 melange d'en2yme et les m&anges combines ont ete incubes dans un thermocycleur 
dans les conditions suivantes : 30 min a 42°C, 10 min a 55°C, 2 min a 94°C suivi de 
40 cycles comprenant une etape de d6naturation a 94°C pendant 10 sec, une etape 
d'hybridation a 55°C pendant 30 sec et une etape d'elongation a 68°C pendant 45 sec, 
avec 3 sec d^ncr&nent par cycle et enfin une etape d'elongation terminale a 68°C 
30 pendant 7 min. 
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Les produits d'amplification ainsi obtenus (amplicons M et E) ont 
subi une deuxieme amplification PCR (PCR nichee) en utilisant le kit Expand High- 
Fi®, Roche), a l'aide des couples d' amorces : 

- S/E/F2/+/26082-261 01 et S/E/R2/-/2641 3-26394 pour l'amplicon E, et 
5 - S/M7F2/+/26330-26350 et S/M/R2/-/27098-27078 pour l'amplicon M. 

Le melange reactionnel contenant : 2 pi du produit de la premiere PCR, 39,25 pi 
d'H 2 Oppi, 5 pi de tampon 10X contenant du MgCl 2 , 2 pi de dNTP (5mM), 0,5pl de 
chacune des amorces (50 pM) et 0,75pl de melange d'enzyme a ete incube dans un 
thermocycleur dans les conditions suivantes : une etape de denaturation a 94°C 
10 pendant 2 min a ete suivie de 30 cycles comprenant une 6tape de denaturation a 94°C 
pendant 15 sec, une etape d'hybridation a 60°C pendant 30 sec et une 6tape 
d'&ongation a 72°C pendant 45 sec, avec 3 sec decrement par cycle, et enfin une 
etape d'elongation tenninale a 72°C pendant 7 min. Les produits d'amplification 
obtenus correspondant aux ADNc codant pour les prolines E et M ont ete sequences 
15 comme ci-dessus, a l'aide des amorces: S/E/F2/+/26082 et S/E/R2/-/26394, 
S/M/F2/+/26330, S/M/R2/-/27078 precitees et des amorces S/M/+/26636-26655 et 
S/M/-/26567-26548. lis ont ensuite ete clones, comme ci-dessus, pour donner les 
plasmides denommes SARS-E et SARS-M. L'ADN de ces clones a ensuite ete isole et 
sequence a l'aide des amorces universelles M13 forward et M13 reverse ainsi que des 
20 amorces S/M/+/26636 et S/M/-/26548 precitees. 

La sequence de l'amplicon representant l'ADNc codant pour la 
proteine E (SEQ ID NO : 13) de la souche de SARS-CoV issue du prelevement 
n°031589 ne comporte pas de differences par rapport aux sequences correspondantes 
des isolats AY274119.3-Tor2 et AY278741-Urbani. La sequence de la proteine E de 
25 la souche de SARS-CoV 031589 correspond a la sequence SEQ ID NO : 14 dans la 
liste de sequences jointe en annexe. 

Le plasmide, denomme SARS-E a ete depose sous le n° 1-3046, le 
28 mai 2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 
rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la s6quence d'ADNc codant 
30 pour la proteine E de la souche de SARS-CoV issue du prelevement repertorie sous le 
n° 031589, telle que definie ci-dessus, laquelle sequence correspondant aux 
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nucleotides des positions 26082 a 26413 (SEQ ID NO :15), en reference a la sequence 
Genbank n° d'acces AY2741 19.3. 

La s6quence de l'amplicon representant l'ADNc codant pour la M 
(SEQ ID NO :16) de la souche de SARS-CoV issue du pr&evement n°031589 ne 
5 comporte pas de differences par rapport k la sequence correspondante de l'isolat 
AY274119.3-Tor2. En revanche, en position 26857, l'isolat AY278741-Urbani 
comporte un c et la sequence de la souche de SARS-CoV issue du prelevement reper- 
torie sous le n°031589 un t. Cette mutation aboutit a une modification de la sequence 
en acides amines de la proteme correspondante: en position 154, une proline 
10 (AY278741-Urbani) est changee en serine dans la souche de SARS-CoV issue du 
pr61evement repertori6 sous le n°031589. La sequence de la proline M de la souche 
de SARS-CoV issue du prelevement r6pertori6 sous le n°031589 correspond a la 
sequence SEQ ID NO :17 dans la liste de sequences jointe en annexe. 

Le plasmide, denomm6 SARS-M a ete depose sous le n° 1-3047, le 
15 28 mai 2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 
rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence d'ADNc codant 
pour la prot6ine M de la souche de SARS-CoV issue du prelevement r^pertorie sous le 
n° 031589, telle que definie ci-dessus ; laquelle sequence correspondant aux 
nucleotides des positions 26330 a 27098 (SEQ ID NO :1 8), en reference a la sequence 
20 Genbank n° d'acces AY2741 1 9.3. 

2.3) ADNc correspondant aux ORF3, ORF4, ORF7 a ORF11 

La raeme stratSgie d'amplification, de clonage et de sequencage a €t€ 
utilis6e pour obtenir les fragments d'ADNc correspondant respectivement aux ORF 
suivantes: ORF 3, ORF4, ORF7, ORF8, ORF9, ORF10 et ORF11. Les couples 
25 d'amorces utilises pour la premiere amplification sont : 

- ORF3 et ORF4 : S/SE/F1/+/25069-25088 et S/SE/R1/-/26300-26281 

- ORF7aORFll : S/MN/F1/+/26898-26917 et S/MN/R1/-/28287-28266 

Les couples d'amorces utilisees pour la deuxieme amplification sont : 

- ORF3 et ORF4 : S/SE/F2/+/251 10-25129 et S/SE/R2/-/26244-26225 
30 - ORF7 a ORF1 1 : S/MN/F2/+/26977-26996 et S/MN/R2/-/2821 8-281 99 

Les conditions de la premiere amplification (RT-PCR) sont les 
suivantes : 45 min a 42°C, 10 min a 55°C, 2 min a 94°C suivi de 40 cycles compre- 
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nant une etape de denaturation a 94°C pendant 15 sec, une etape d'hybridation a 58°C 
pendant 30 sec et une etape d'elongation a 68°C pendant 1 min, avec 5 sec decre- 
ment par cycle et enfin une etape d'elongation terminate a 68°C pendant 7 min. 
Les conditions de la PCR nichee sont les suivantes : une etape de denaturation a 94°C 
5 pendant 2 min a ete suivie de 40 cycles comprenant une &ape de denaturation a 94°C 
pendant 20 sec, une etape d'hybridation a 58°C pendant 30 sec et une 6tape 
d'elongation a 72°C pendant 50 sec, avec 4 sec decrement par cycle et enfin une 
etape d'elongation terminate a 72°C pendant 7 min. 

Les produits d'amplification obtenus correspondant aux ADNc 
10 contenant respectivement les ORJF3 et 4 et les ORF7 a 1 1 ont ete sequences a 1'aide 
des amorces: S/SE/+/25363, S/SE/+/25835, S/SE/-/25494, S/SE/-/25875, 
S/MN/+/27839, S/MN/+/27409, S/MN/-/27836 S/MN/-/27799 et clones comme cx- 
dessus pour les autres ORF, pour donner les plasmides denommes SARS-SE et 
SARS-MN. L'ADN de ces clones a ete isole et sequence a l'aide de ces memes 
15 amorces et des amorces universelles M13 sens et M13 anti-sens. 

La sequence de l'amplicon represents I'ADNc de la r6gion conte- 
nant les ORF 3 et 4 (SEQ ID NO :7) de la souche de S ARS-CoV issue du prelevement , 
n°031589 comporte une difference nucleotidique par rapport a la sequence corres- 
pondante de l'isolat AY274119-Tor2. Cette mutation en position 25298 aboutit a une 
20 modification de la sequence en acides amines de la proteine correspondante (ORF 3): 
en position 11, une arginine (AY274119-Tor2) est changee en glycine dans la souche 
de SARS-CoV issue du prelevement n°031589. En revanche, aucune mutation n'a ete 
identiftee par rapport a la sequence correspondante de l'isolat AY278741-Urbani. Les 
s6quences des ORF 3 et 4 la souche de SARS-CoV issue du ptelevement n°031589 
25 correspondent respectivement aux sequences SEQ ID NO :10 et 12 dans la liste de 

sequences jointe en annexe. 

Le plasmide, denomme SARS-SE a ete depose sous le n° 1-3126, le 
13 novembre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15; il contient 
30 I'ADNc correspondant a la region situee entre l'ORF-S et l'ORF-E et chevauchant 
l'ORF-E de la souche de SARS-CoV issue du prelevement repertorie sous le n° 
031589, telle que d6finie ci-dessus, laquelle region correspondant aux nucleotides des 
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positions 25110 a 26244 (SEQ ID NO :8), en reference a la sequence Genbank n° 
d'accesAY274119.3, 

La sequence de 1'amplicon reprdsentant PADNc correspondant a la 
region contenant les ORF7 a ORF11 (SEQ ID NO :19) de la souche de SARS-CoV 
5 issue du prelevement n°031589 ne comporte pas de differences par rapport aux 
sequences correspondantes des isolats AY274119-Tor2 et AY278741-UrbanL Les 
sequences des ORF7 & 1 1 de la souche de SARS-CoV issue du prelevement n°031589 
correspondent respectivement aux sequences SEQ ID NO : 22, 24, 26, 28 et 30 dans la 
liste de sequences jointe en annexe. 

10 Le plasmide denommeSARS-MN a ete depose sous le n° 1-3 125, le 

13 novembre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15; il contient la 
sequence d'ADNc correspondant h la region situee entre PORF-M et l'ORF-N de la 
souche de SARS-CoV issue du prelevement repertorie sous le n° 031589 et prelevee a 

15 Hanoi, telle que d6finie ci-dessus, laquelle sequence correspondant aux nucleotides 
des positions 26977 a 28218 (SEQ ID NO :20 ), en reference a la sequence Genbank 
n° d'accesAY274119.3. 

La sequence de Pamplicon representant TADNc correspondant a la 
region contenant les ORF7 a ORF1 1 (SEQ ID NO :19) de la souche de SARS-CoV 

20 issue du prelevement n°031589 ne comporte pas de differences par rapport aux 
sequences correspondantes des isolats AY274119-Tor2 et AY278741-Urbani. Les 
sequences des ORF7 a 11 de la souche de SARS-CoV issue du prelevement n°031589 
correspondent respectivement aux sequences SEQ ID NO : 22, 24, 26, 28 et 30 dans la 
liste de sequences jointe en annexe. 

25 2A) ADNc codant pour la proline N et incluant les ORF13 et ORF14 

L'ADNc a ete synthetise et amplifie comme decrit ci-dessus pour les 
fragments Sa et Sb. De maniere plus precise, le melange r6actionnel contenant : 5 \x\ 
d'ARN, 5 \i\ d'H 2 0 ppi 4 jjJ de tampon de reverse transcriptase 5X, 2 \x\ de dNTP (5 
mM), 2 fil d'oligo 20T (5 jiM), 0,5 ^1 deRNasin (40 UI/ul) et 1, 5 \i\ de AMV-RT (10 

30 UI/ul Promega) a ete incubS dans un thermocycleur dans les conditions suivantes : 45 
min a 42°C, 15 min a 55°C, 5 min a 95°C, puis il a 6t6 maintenu a +4°C. 
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U»e prendre amplification PCR a M rialisee avec la pah. 
dWrcesS/N/F3/ + /28023etS/N/R3/-/29480. . 

Le melange reactionnel comme ci-dessus pour Tamphficafon des 
SI et S2 a 6.6 incube dans un thennocycleur, dans les conditions suivan,es : 
^ape initiale de dfeaturation a 94'C pendan. 2 min a M suivie do 40 cycles 

pendan, 30 sec puis uno etape d-elongation a 72«C pendant 1 -. 30 sec avec 

d'eloneation a 72°C pendant 5 min. 
„ L-amplicon obtenu a ,a premiere amplification PGR a sub, une 

seCT nde aape ^amplification PCR (PCR nichee) avec la ~ 
S/N/F4W28054 e, S/N/R4/-/29430 dans des conditions idenhques a celles 

, 5 now la proline N de la souche de SARS-CoV issue du prelevement n°031589a ete 
15 " ties amorces: S.—4, 3^9430 — , 

S/NW28918 e, S/N/-/28607 et clone comme ci-dessus pour les aufres ORF, pou 
donner le pUsmide denomme SARS-N. L'ADN de ces clones a ete isole * sconce a 

• „« vrn ™« et M13 anti-sens, ainsi que des amorces 
Paide des amorces universelles M13 sens et Mia n 

20 S «/+/28468,S/N/+/28918etSyNM28607. 

La sequence de Pamplicon represent. PADNc correspondent a 
PORF-N e, ineluan, les ORF13 et ORF14 (SEQ ID NO :36) de la souche de SARS- 
CoV issue du prelevemen, n°031589 ne oomporte pas de differences par rapport an* 

CoV issue p A Y274119 3-Toi2 et AY278741-Olbam. La 

sequences correspondantes des isolate AY274119.3 tor 

25 sLnce de la proteine N de la souche de SARS-CoV issne du prelevemen. n 03 1 589 
JLpond a la sequence SEQ ID NO : 37 dans la Hste de s^ences jointe en annexe. 

Les sequences des ORF13 et 14 de la souche de SARS-CoV issue du 
pavement n°031589 corespondent respeouvemen, aux sequences SEQ ID NO : 32 
et 34 dans la listede sequences jointe en annexe. 

30 Le plasmide dtoomme SARS-N a e,4 depose sous le n 1-3048, le 

join 2003, auprts de la Collection Nationale de Cultures de Micoorganismes, 25 rue 
du Docteur Roux, 75724 Paris Cetiex .5 ; il contien, l'ADNc codan. pour la proteme 
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N de la souche de SARS-CoV issue du pr61£vement repertory sous le n° 031 589, telle 

que definie ci-dessus, laquelle sequence correspondant aux nucleotides des positions 

28054 a 29430 (SEQ ID NO :38), en reference a la sequence Genbank n° d'acces 

AY274119.3. 
5 2,5) extremites 5* et 3' non-codantes 

a) extremity 5'non-codante (5'NC) 

ai) synthese de l!ADNc 

Les ARN issus du pr61evement 031589, extraits comme ci-dessus, 

ont 6t6 soumis a une transcription inverse dans les conditions suivantes : 
!0 L'ARN (15 ill) et 1'amorce S/L/-/443 (3 jul a la concentration de 

5pn, ont ete incubes 1 0 min a 75°C. 

Ensuite, du Tampon de transcriptase inverse 5X (6 \xl 9 

INVITROGEN), des dNTP 10 mM (1 *il), du DTT 0,1M (3 jul) ont ete ajout6s et le 

melange a ete incube a 50°C pendant 3 min. 
15 Enfin la transcriptase inverse (3 jllI de Superscript®, INVITROGEN) 

a ete ajoutee au m61ange precedent qui a ete incube a 50°C pendant lh30 puis h 90 °C 

pendant 2 min. 

L'ADNc ainsi obtenu a ete purifie a Taide du kit QIAquick PCR 
purification (QIAGEN), selon les recommandations du fabricant 

20 bj) (TdT) 

L'ADNc (10 jxl) est incube 2 min a 100°C, conserve dans la glace, 
puis sont ajoutes : H 2 0 (2,5 jal), tampon TdT 5X (4 jj], AMERSHAM), dATP 5mM 
(2 et TdT (1,5 jil, AMERSHAM). Le melange ainsi obtenu est incube 45 min a 
37°C puis2mina65°C. 

25 Le produit obtenu est amplify par une premiere reaction PCR a 1'aide 

des amorces: S/L/-/225-206 et ancre 14T: 5'- 

AGATGAATTCGGTACCTTTTTT^ ' (SEQ ID NO :68). Les conditions 

de P amplification sont les suivantes : une etape initiale de denaturation a 94°C 
pendant 2 min est suivie de 10 cycles comprenant une etape de denaturation a 94°C 

30 pendant 10 sec, une 6tape d'hybridation a 45°C pendant 30 sec puis une 6tape 
d'elongation a 72°C pendant 30 sec puis de 30 cycles comprenant une etape de dena- 
turation a 94°C pendant 10 sec, une <§tape d'hybridation a 50°C pendant 30 sec puis 
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une etape d'elongation a 72°C pendant 30 sec, puis d'une etape finale d'elongation a 

72°C pendant 5 min. 

Le produit de la premiere amplification PCR a subi une seconde 
etape ^amplification a l'aide des amorces : S/L/-/204-185 et ancre 14T precitee dans 
5 des conditions identiques a celles de la premiere amplification. L'amplicon ainsi 
obtenu a ete purifie, sequence a l'aide de 1'amorce S/L/-/182-163 puis il a ete clon6 
comme ci-dessus pour les differentes ORF, pour donner le plasmide denomme SARS- 
5'NC. L'ADN de ce clone a ete isole et s6quence a l'aide des amorces universelles 
M13 sensetM13 anti-sens etde 1'amorce S/L/-/182-163 precitee. 
10 L'amplicon represents l'ADNc correspondant a I'extremite 5'NC 

de la souche de SARS-CoV issue du prelevement repertoriS sous le n° 031589 
correspond a la sequence SEQ ID NO : 72 dans la liste de sequences jointe en annexe ; 
cette sequence ne comporte pas de differences par rapport aux sequences 
correspondantes des isolats AY274119.3-Tor2 et AY278741-Urbani. 
15 Le plasmide denomme SARS-5'NC a ete depose sous le n° I- 3124, 

le 7 novembre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient 
l'ADNc correspondant a I'extremite 5'non codante du genome de la souche de SARS- 
CoV issue du prelevement repertorie sous le n° 031589, telle que d6finie ci-dessus, 
20 laquelle sequence correspondant aux nucleotides des positions 1 a 204 (SEQ ID 
NO :39 ), en reference a la sequence Genbank n° d'acces AY2741 19.3. 
b) ftxtr6mit6 3'non-codante (3'NC) 
ai).s^tMsedei:ADNc 

Les ARN issus du prelevement 031589, extraits comme ci-dessus, 
25 ont et6 soumis a une transcription inverse, selon le protocole suivant : le melange 
reactionnel contenant : ARN (5 ul), H 2 0 (5 ul), tampon de transcriptase inverse 5X (4 
ul), dNTP 5 mM (2 ul), Oligo 20T 5uM (2 ul), RNasin 40 U/ ul (0,5 ul) et RT-AMV 
10 Ul/ ul (1,5 ul, PROMEGA) a ete incube dans un thermocycleur, dans les conditi- 
ons suivante's : 45 min a 42°C, 15 min a 55°C, 5 min a 95°C, puis il a ete maintenu a 
30 +4°C. 

L'ADNc obtenu a ete amplifie par une premiere reaction PCR a 
l'aide des amorces S/N/+/28468-28487 et ancre 14T precitee. Les conditions de 
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P amplification sont les suivantes : une etape initiate de denaturation a 94°C pendant 2 
min est suivie de 10 cycles comprenant une etape de denaturation a 94°C pendant 20 
sec, une etape d'hybridation a 45°C pendant 30 sec puis une etape d'elongation a 
72°C pendant 50 sec puis de 30 cycles comprenant une etape de denaturation a 94°C 
5 pendant 20 sec, une etape d'hybridation a 50°C pendant 30 sec puis une etape 
d'elongation a 72°C pendant 50 sec, puis d'une etape finale d'elongation a 72°C 
pendant 5 min. 

Le produit de la premiere amplification PCR a subi une seconde 
etape d'amplification a Paide des amorces S/N/+/28933-28952 et ancre 14T pr6cit6e, 
10 dans des conditions identiques a celles de la premiere amplification. L'amplicon ainsi 
obtenu a et6 purifie, sequence a I'aide de Pamorce S/N/+/29257-29278 et clone 
comme ci-dessus pour les diffSrentes ORF, pour donner le plasmide denomme SARS- 
3'NC. L/ADN de ce clone a ete isole et sequence a Taide des amorces universelles 
Ml 3 sens et Ml 3 anti-sens et de Pamorce S/N/+/29257-29278 precitee. 
15 L'amplicon repr6sentant PADNc correspondant a P extremity 3'NC 

de la souche de SARS-CoV issue du prelevement repertorie sous le n° 031589 corres- 
pond a la sequence SEQ ID NO :73 dans la liste de sequences jointe en annexe ; cette 
sequence ne comporte pas de differences par rapport aux sequences correspondantes 
des isolats AY2741 19.3-Tor2 et AY278741-Urbani. 
20 Le plasmide denomm<§ SARS-3'NC a ete depose sous le n° 1-3123 le 

7 novembre 2003, aupres de la Collection Nationale de Cultures de Microorganismes, 
25 rue du Docteur Roux, 75724 Paris Cedex 15. ; il contient la sequence d'ADNc 
correspondant h Pextr&nite 3'non codante du genome de la souche de SARS-CoV 
issue du prelevement r£pertori6 sous le n° 031589, telle que definie ci-dessus, laquelle 
25 sequence correspondant a celle situ6e entre le nucleotide en position 28933 a 29727 
(SEQ ID NO :40), en r6f&rence k la sequence Genbank n° d'acces AY274119.3, se 
termine par une serie de nucleotides a. 
2.6)ORFlaetORFlb 

I/amplification de la' region 5' contenant les ORFla et ORFlb du 
30 genome du SARS-CoV issu du prelevement 031589 a 6te r6alis6e en pratiquant des 
reactions de RT-PCR suivies de PCR nich<§es selon les memes principes que ceux 
precedemment dScrits pour les autres ORF. Les fragments amplifies sont chevau- 
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chants sur plusieurs dizaines de bases, permettant ainsi la reconstruction informatique 
de la sequence complete de cette partie du g6nome. En moyenne, les fragments ampli- 

fi6s sont de deux kilobases. 

14 fragments chevauchants denommes LO a LI 2 ont ainsi ete 

amplifies a l'aide des amorces suivantes : 

Tableau II : Amorces utilisees pour 1' amplification 



5 



REGION 
AMPLIFIES 
ET 

SFOUENCEE 
(ne tient pas 

nnmote des 

amorces) 


Amorce sens 
RT-PCR 


Amorce antisens 
RT-PCR 


Amorce sens 
PCR n tehee 


Amorce 
antisens PCR 
nichee 


LO 
50-480 


S/L0/F1/+30 


S/L0/R1/-481 






L1 

231-2240 


S/L1/F1/+147 


S/L1/R1/-2336 


S/L1/F2/+211 


S/L1/R2/-2241 


2156-4167 




S/L2/R1/-4192 


S/L2/F2/+2136 


S/L2/R2/-4168 


L3 

3913-5324 


S/L3bis/F1/+3850 


S/L3bis/R1/-5365 


S/L3bis/F2/+3892 


S/L3bis/R2/-5325 


L4b 
4952-6023 


S/L4b/F1/+4878 


S/L4b/R1/-6061 


S/L4b/F2/+4932 


S/L4b/R2/-6024 


L4 

5325-7318 


S/L4/F1/+5272 


S/L4/R1/-7392 


S/L4/F2/+5305 


S/L4/R2/-7323 


L5 

7296-9156 


S/L5/F1/+7111 


S/L5/R1/-9253 


S/L5/F2/+7275 


S/L5/R2/-9157 


L6 

9053-11066 


S/L6/F1/+8975 


S/L6/R1/-11151 


S/L6/F2/+9032 


S/L6/R2/-11067 


L7 

10928-12962 


S/L7/F17+10883 


S/L7/R1/-13050 


S/L7/F2/+10928 


S/L7/R2/-12963 


L8 

12835-14834 


S/L8/F1/+12690 


S/L8/R1/-14857 


S/L8/F2/+12815 


S/L8/R2/-14835 


L9 

14765-16624 


S/L9/F1/+14688 


S/L9/R1/-16678 


S/L9/F2/+14745 


S/L9/R2M6625 


L10 
16534-18570 


S/L10/F1/+16451 


S/L10/R1/-18594 


S/L10/F2/+16514 


S/L10/R2/-18571 


L11 
18521-20582 


S/L11/F1/+18441 


S/L11/R1/-20612 


S/L11/F2/+18500 


S/L11/R2/-20583 


L12 


S/L12/F1/+20279 


S/L12/R1/-22229 


S/L12/F2/+20319 


S/L12/R2/-22206 



excepte le fragment L0 qui a ete amplifie comme decrit ci-dessus pour l'ORF-M : 

- RT-PCR : 30 min a 42°C, 15 min a 55°C, 2 min a 94°C, puis 
l'ADNc obtenu est amplifie dans les conditions suivantes : 40 cycles comprenant : une 
etape de denaturation a 94°C pendant 15 sec, une etape d'hybridation a 58°C pendant 
30 sec puis une etape d'elongation a 68°C pendant 1 min 30 sec, avec 5 sec 
d'elongation supplemental^ a chaque cycle, puis une etape finale d'elongation a 68°C 
5 pendant 7 min. 
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- PCR nichee : une etape initiale de d6naturation a 94°C pendant 2 
min est suivie de 35 cycles comprenant : une etape de denaturation a 94°C pendant 1 5 
sec, une etape d'hybridation a 60°C pendant 30 sec puis une etape d'elongation a 
72°C pendant 1 min 30 sec, avec 5 sec d'elongation suppl&nentaire k chaque cycle, 
5 puis une dtape finale d'elongation a 72°C pendant 7 min. 

Les produits d'amplifications ont ete sequences a Faide des amorces 
definies dans le Tableau III ci-apres : 

Tableau III : Amorces utilisees pour le sequen^age 
de la region 5* (ORFla et ORFlb) 



Noms 


Sequences (SEQ ID NO : 76 a 139) 


S/L3/+/4932 


5-CCACACACAGCTTGTGGATA-3' 


S/L4/+/6401 


5'-CCGAAGTTGTAGGCAATGTC-3' 


S/L4/+/6964 


5'- 1 I I GGTGCTCCTTCTTATTG-3' 


O It A 1 tr>n A ~~r 

S/L4/-/681 7 


5'-CCGGCATCCAAACATAA I I I -3" 


S/L5/-/7633 


5'-TGGTCAGTAGGGTTGATTGG-3' 


S/L5/-/8127 


5'-CATCCTTTGTGTCAACATCG-3' 


O IX tt 1 m^on 

5/L5/-/8633 


5'-GTCACGAGTGACACCATCCT-3' 


Oil c f i /TrrvoA 

S/L5/+/7839 


5-ATGCGACGAGTCTGCTTCTA-3' 


S/L5/+/8785 


5'-TTCATAGTGCCTGGCTTACC-3' 


S/L5/+/8255 


5'-ATCTTGGCGCATGTATTGAC-3' 


S/L6/-/9422 


S'-TGCATTAGCAGCAACAACAT-S' 


O/ LO/ -/ y y DO 


o-IOI GOAGAACAGCAGAAGTG-3 


S/L6/-/10542 


5'-CCTGTGCAGTTTGTCTGTCA-3' 


S/L6/+/10677 


5-CCTTGTGG CAATG AAGTACA-3' 


S/L6/+/10106 


5*-ATGTCAI 1 1 GCACAGCAGAA-3' 


S/L6/+/9571 


S'-CTTCAATGGTTTGCCATGTT-S' 


S/L7/-/11271 


5-TGCGAGCTGTCATGAGAATA-3' 


S/L7/-/11801 


5'-AACCGAGAGCAGTACCACAG-3' 


S/L7/-/12383 


5'-TTTGGCTGCTGTAGTCAATG-3' 


S/L7/+/12640 


5-CTACGACAGATGTCCTGTGC-3' 


S/L7/+/12088 


5*-GAGCAGGCTGTAGCTAATGG-3' 


S/L7/+/11551 


5'-TTAGGCTATTGTTGCTGCTG-3' 


S/L8/-13160 


5'-CAGACAACATGAAGCACCAC-3' 


S/L8/-/13704 


5-CGCTGACGTGATATATGTGG-3' 


S/L8/-14284 


5-TGCACAATGAAGGATACACC-3' 


S/L8/+/14453 


5'-ACATAGCTCGCGTCTCAGTT-3' 


S/L8/+/13968 


5'-GG CATTGTAGGCGTACTGAC-3' 


S/L8/+/13401 


5'-GI 1 1 GCGGTGTAAGTGCAG-3' 


S/L9/-15098 


5'-TAGTGGCGGCTATTGACTTC-3' 


S/L9/-15677 


5'-CTAAACCTTGAGCCGCATAG-3* 


S/L9/-16247 


5'-CATGGTCATAGCAGCACTTG-3* 


S/L9/+16323 


5-CCAGGTTGTGATGTCACTGAT-3' 


S/L9/+15858 


S'-CCTTACCCAGATCCATCAAG-S" 


S/L9/+15288 


S'-CGCAAACATAACACTTGCTG-S' 


S/L10/-16914 


5-AGTGTTGGGTACAAGCCAGT-3' 


S/L10/-17466 


5'-GTTCCAAGGAACATGTCTGG-3' 


S/L10/-18022 


5'-AGGTGCCTGTGTAGGATGAA-3' 


S/L10/+18245 


5'-GGGCTGTCATGCAACTAGAG-3' 


S/L10/+17663 


5'-TCTTACACGCAATCCTGCTT-3' 
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S/L10/+17061 
S/L11/-/18877 
S/L11M9396 
S/L11/-20002 
S/L11/+20245 
S/L11/+/19611 
S/L11/+/19021 
SARS/L1/F3/+800 
SARS/L1/F4/+1391 
SARS/L1/F5/+1925 
SARS/L1/R3/-1674 
SARS/L1/R4/-1107 
SARS/L1/R5/-520 
SARS/L2/F3/+2664 
SARS/L2/F4/+3232 
SARS/L2/F5/+3746 
SARS/L2/R3/-3579 
SARS/L2/R4/-2991 
SARS/L2/R5/-2529 
SARS/L3/F3/+4708 
SARS/L3/F4/+5305 
SARS/L3/F5/+5822 
SARS/L3/R3/-5610 
SARS/L3/R4/-4988 
SARS/L3/R5/-4437 



5'-TACCCATCTGCTCGCATAG 1 -3 

5'-GCAAGCAGAATTAACCCTCA-3' 

5'-AGCACCACCTAAATTGCATC-3' 

S'-TGGTCCCTTTGAAGGTGTTA-S' 

5'-TCGAACACATCGTTTATGGA-3' 

5'-GAAGCACCTGTTTCCATCAT-3' 

5-ACGATGCTCAGCCATGTAGT-3' 

5'-GAGGTGCAGTCACTCGCTAT-3' 

5*-CAGAGATTGGACCTGAGCAT-3* 

5'-CAGCAAACCACTCAATTCCT-3' 

^AAATGAyGGCAACCTCTTCA-S' 

5'-CACGTGGTTGAATGACTTTG-3' 

5*-ATTTCTGCAACCAGCTCAAC-3' 

5'-CGCATTGTCTCCTGGTTTAC-3' 

5'-GAGATTGAGCCAGAACCAGA-3' 

5'-ATGAGCAGGTTGTCATGGAT-3' 

5'-CTGCCTTAAGAAGCTGGATG-3' 

5--TTTCTTCACCAGCATCATCA-3' 

5 , -CACCGTTCTTGAGAACAACC-3 , 

5'-TCTTTGGCTGGCTCTTACAG-3' 

5'-GCTGGTGATGCTGCTAACTT-3' 

5*-CCATCAAGCCTGTGTCGTAT-3" 

5-CAGGTGGTGCAGACATCATA-3' 

5'-AACATCAGCACCATCCAAGT-3' 

5'-ATCGGACACCATAGTCAACG-3' 



Les sequences des fragments LO a L12 de la souche de SARS-CoV 
issue du prelevement repertorie sous le n° 031589, correspondent respectivement aux 
sequences SEQ ID NO :41 a SEQ ID NO :54 dans la liste de sequences jointe en 
annexe. Parmi ces sequences, seule celle correspondant aux fragments L5 comporte 
une difference nucleotidique par rapport a la sequence correspondante de l'isolat 
AY278741-Urbani. Cette mutation t/c en position 7919 aboutit a une modification de 
la s6quence en acides amin6s de la proline correspondante, codee par l'ORF la: en 
position 2552, une valine (codon gtt ; AY278741) est changee en alanine (codon get) 
dans la souche de SARS-CoV 031589. En revanche, aucune mutation n'a ete identifiee 
par rapport a la sequence correspondante de l'isolat AY274119.3-Urbani. Les autres 
fragments ne presentent pas de differences par rapport aux s6quences correspondantes 
des isolats Tor2 et Urbani. 
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Exemple 2 : Production et purification de proteines N et S recombinantes de la 
souche de SARS-CoV issue du prelevement repertorie sous le nuraero 031589 

La proteine entiere et deux fragments polypeptidiques de la proline 
S de la souche de SARS-CoV issue du prelevement repertorie sous le numero 031589 
ont ete produites chez E. coli, sous forme de proteines de fusion comprenant une 
etiquette polyhistidine N-ou C-terminale. Dans les deux polypeptides S, les sequences 
hydrophobes N et C-terminales de la proteine S (peptide signal : positions 1 a 13 et 
helice transmembranaire : positions 1 196 a 1218) ont ete deletees alors que l'helice (3 
(positions 565 k 687) et les deux motifs de type coiled-coils (positions 895 a 980 et 
1 155 a 1 186) de la proteine S ont et6 preserves. Ces deux polypeptides sont constitues 
par : un fragment long (S L ) correspondant aux positions 14 a 1 193 de la sequence en 
acides amines de la proteine S et un fragment court (S c ) correspondant aux positions 
475 a 1 193 de la sequence en acides amines de la proteine S. 
1) Clonage des ADNc N, S L et S c dans les vecteurs d'expression pIVEX2.3 et 
pIVEX2.4 

Les ADNc correspondant a la proteine N et aux fragments S L et S c 
ont 6te amplifies par PCR dans des conditions standard, a l'aide de l'ADN polymerase 
Platinium Pfx® (INVITROGEN). Les plasmides SRAS-N et SRAS-S ont ete utilises 
comme matrice et les oligonucleotides suivants comme amorces : 
5^CCCMATGTCTGATAATGGACCCCAATCAAAC-3' (N sens, SEQ ID NO :55) 
5 5 -CCCCCGGGTGCCTGAGTTGAATCAGCAGAAGC-3 > (N antisens, SEQ ID NO :56) 
5 *-CCCAXATGAGTG ACCTTG ACCGGTGC ACCAC-3 ' (S c sens, SEQ ID NO :57) 
5'-CCCMW^GAAACCTTGCACCCCACCTGCTC-3 , (S L sens, SEQ ID NO :58) 
5 9 -CCCOCGGGTTT AATATATTGCTCATATTTTC ' (S c et S L antisens, SEQ ID 
NO :59). 

Les amorces sens introduisent un site Ndel (souligne) alors que les 
amorces antisens introduisent un site Xmal tai Smal (souligne). Les 3 produits 
d'amplification on 6te purifies sur colonne (kit QIAquickPCR Purification, QIAGEN) 
et clon6s dans un vecteur appropri6. L'ADN plasmidique purifie des 3 constructions 
(kit QIAFilter Midi Plasmid, QIAGEN) a et6 verify par sequen9age et digere par les 
enzymes Ndel ctXmal. Les 3 fragments correspondants aux ADNc N, S L et S c ont et<§ 
purifies sur gel d' agarose puis inserts dans les plasmides pIVEX2.3MCS (etiquette 
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polyhistidine C-terminale) et pIVEX2.4d (etiquette polyhistidine N-tenninale) pr6ala- 
blement digeres par les memes enzymes. Apres verification des constructions, les 6 
vecteurs depressions ainsi obtenus ( P IV2.3N, P IV2.3S C , P IV2.3S L , pIV2.4N, 
P IV2.4Sc egalement denomm6 P IV2.4S,, P IV2.4S L ) ont 6te ensuite utilises, d'une part 
5 pour tester Impression des proteines in-vitro, et d'autre part pour transformer la 
souchebacterienne BL21(DE3)pDlA17 (NOVAGEN). Ces constructions codent pour 
des proteines dont la masse moleculaire attendue est la suivante : pIV2.3N (47174 
Da), P IV2.3Sc (82897 Da), P IV2.3S L (132056 Da), P IV2.4N (48996 Da), P IV2.4 Sl 
(81076 Da) et P IV2.4Sl(1 33877 Da). 
10 2) Analyse de V expression des proteines recombinantes in-vitro et in vivo 

L'expression de proteines recombinantes a partir des 6 vecteurs 
recombinants a ete testee, dans un premier temps, dans un systeme in-vitro (RTS100, 
Roche). Les proteines produites in vitro, apres une incubation des vecteurs recombi- 
nants pIVEX, 4h a 30°C, dans le systeme RTS100, ont ete analysees par western-blot 
1 5 a l'aide d'unanticorps anti-(his) 6 couple a la peroxydase. Le resultat d'expression in- 
vitro (Figure 1) montre que seule la proteine N est exprim6e en quantites importantes, 
cela quelle que soit la position, N- ou C-terminale, de l'etiquette polyhistidine. Dans 
une seconde etape, l'expression des proteines N et S a 6te testee in-vivo a 30°C dans 
du milieu LB, en presence ou en l'absence d'inducteur (IPTG ImM). La proteine N 
20 est tres bien produite dans ce systeme bacterien (Figure 2) et se retrouve principale- 
ment dans une fraction soluble apres lyse des bacteries. En revanche, la version longue 
de S (S L ) est tres peu produite et complement insoluble (Figure 3). La version courte 
(S C ) presente egalement une tres feible solubilite, mais un taux d'expression beaucoup 
plus eleve que celui de la version longue. Par ailleurs, la construction S c fusionnee a 
25 une etiquette polyhistidine en position C-terminale presente une taille plus faible que 
celle attendue. Une exp6rience d 'immunodetection avec un anticorps anti-poly- 
histidine a montre que cette construction etait incomplete. En conclusion, les deux 
constructions, pIV2.3N et prV2.4Sj, exprimant respectivement la proteine N entiere 
fusionnee a l'etiquette polyhistidine en C-terminal et la proteine S courte fusionnee a 
30 l'etiquette polyhistidine en N-terminal, ont 6te retenues pour produire les deux 
proteines en grande quantite afm de les purifier. 
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3) Analyse de 1'activite antigenique des proteines recombin antes 

L'activite antigenique des proteines N, Sl et Sc a ete test6e par 
western-blot, a Taide de deux 6chantillons de serum, provenant d'un meme patient 
infecte par le SARS-CoV, preleves 8 jours (M12) et 29 jours-(M13) apr&s le debut des 
5 symptomes du SRAS. Le protocole experimental est comme decrit a Pexemple 3. Les 
resultats illustres par la figure 4 montrent (i) la seroconversion du patient, et (ii) que la 
proline N possede une plus forte reactivate antigenique que la proteine S courte. 

4) Purification de la proteine N a partir de pIV2.3N 

Plusieurs experiences de purification de la proteine N, produite a 

10 partir du vecteur pF/2.3N, ont ete r&disees selon le protocole suivant Les bacteries 
BL21(DE3)pDIA17, transformees par le vecteur depression pIV2.3N, ont ete culti- 
v£es a 30°C dans 1 litre de milieu de culture contenant 0,1 mg/ml d'ampicilline, et 
induites par 1 raM IPTG quand la densite cellulaire, equivalente a A 6 oo = 0,8, est 
atteinte (environ 3 heures). Apres 2 heures de culture en presence d'inducteur, les 

1 5 cellules ont et6 recuperees par centrifugation (1 0 min a 5000 rpm), remises en suspen- 
sion dans le tampon de lyse (50 mM NaH 2 P0 4 , NaCl 0,3 M, 20 mM imidazole, pH 8 
contenant le melange d'inhibiteurs de proteases Complete® , Roche), et lysees par la 
presse de French (12000 psi). Apres centrifugation du lysat bacterien (15 min a 12000 
rpm), le surnageant (50 ml) a ete depos<§ a un debit de lml/min sur une colonne (15 

20 ml) de chelation metallique (Ni-NTA superflow, Qiagen), ^quilibree par le tampon de 
lyse. Apres lavage de la colonne par 200 ml de tampon de lyse, la proteine N a ete 
eluee par un gradient d'imidazole (20 ->250 mM) en 10 volumes de colonne. Les 
fractions contenant la proteine N ont ete rassemblees et analysees par electrophor^se 
en gel de polyacrylamide en conditions denaturantes puis coloration au bleu de 

25 Coomassie. Les resultats illustres par la figure 5 montrent que le protocole employe 
permet de purifier la proteine N avec une homogeneite tres satisfaisante (95%) et un 
rendement moyen de 15 mg de proteine par litre de culture. 

5) Purification de la proteine S c a partir de pIV2.4S c (pIV2.4Si) 

Le protocole suivi pour purifier la proteine S courte est tres different 
30 de celui decrit ci-dessus car la proteine est fortement aggregee dans le systeme bacte- 
rien (corps d'inclusion). Les bacteries BL21(DE3)pDIA17, transformees par le 
vecteur d' expression pIV2.4Sj ont et6 cultivees a 30°C dans 1 litre de milieu de 
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culture contenant 0,1 mg/ml d'ampicilline, et induites par 1 mM IPTG quand la 
density cellulaire, equivalente a A 60 o = 0,8, est atteinte (environ 3 heures). Apres 2 
heures de culture en presence d'inducteur, les cellules ont ete recuperees par centrifu- 
gation (10 min a 5000 ipm), remises en suspension dans le tampon de lyse (0,1 M 
5 Tris-HCl, EDTA 1 mM, pH 7,5), et lysees par- la presse de French (1200 psi). Apres 
centrifugation du lysat bacterien (15 min a 12000 rpm), le culot a ete remis en suspen- 
sion dans 25 ml de tampon de lyse contenant 2% Triton X100 et 10 mM P- 
mercaptoethanol, puis centrifuge pendant 20 min a 12000 rpm. Le culot a ete remis en 
suspension dans un tampon Tris-HCl 10 mM contenant 7 M uree, et mis en agitation 
10 douce pendant 30 min a temperature ambiante. Ce dernier lavage des corps 
d'inclusion avec 7 M uree est necessaire pour eliminer la plupart des proteines 
membranaires d'E. coli qui co-sedimentent avec la proteine S c aggr6gee. Apres une 
derniere centrifugation pendant 20 min a 12000 rpm, le culot final est remis en 
suspension dans le tampon Tris-HCl 10 mM. L'analyse electrophor6tique de cette 
15 preparation (Figure 6) montre que la proteine S courte peut etre purifiee avec une 
homogeneite satisfaisante (environ 90%) a partir des corps d'inclusion (extrait 
insoluble). 

Exemple 3 : Immunodominance de la proteine N 

La reactivite des anticorps presents dans le serum des patients 
20 atteints de pneumopathie atypique causee par le coronavirus associe au SRAS (SARS- 
CoV), vis-a-vis des differentes prot6ines de ce virus, a ete analys6e par western-blot 
dans les conditions decrites ci-apres. 
1) Materiel 

a) Ivsat de cellules infectees par le SARS-CoV 

25 Des cellules Vero E6 (2x1 0 6 ) ont ete infectees par le SARS-CoV 

(isolat r6pertorie sous le num6ro FFM/MA104) a une multiplicite d'infection (M.O.I.) 
de lO" 1 ou 10" 2 puis incubees dans du milieu DMEM contenant 2% de SVF, a 35°C 
dans une atmosphere contenant 5% de C0 2 . 48 heures plus tard, le tapis cellulaire a 
ete lave avec du PBS puis lyse avec 500 ul de tampon de depot prepare selon Laemmli 

30 et contenant du 6-mercaptoethanol. Les echantillons ont ensuite ete bouillis 10 
minutes puis soniques 3 fois 20 secondes. 
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b) anticorps 

bi) seipm de.patiert 

Le s6rum reference au Centre National de Reference des virus 
influenzae (Region-Nord) sous le N° 20033168 est celui d'un patient fran9ais atteint 
5 d'une pneumopathie atypique causee par le SARS-CoV preleve au jour 38 apres le 
debut des symptomes ; le diagnostic d'infection par le SARS-CoV a ete realise par 
RT-PCR nichee et PCR quantitative. 
b2> senims.p.ol^ 
prpteine S 

10 Les serums sont ceux produits a partir des proteines recombinantes N 

et S c (exemple 2), selon le protocole d'immunisation decrit a l'exemple 4 ; il s'agit du 
s6rum du lapin P13097 (serum anti-N) et du serum du lapin PI 1 135 (serum anti-S). 
2) Methode 

20 \i\ de lysat de cellules infectees par le SARS-CoV a des M.OJ. de 
15 10' 1 et 10' 2 et, k titre de controle, 20 \i\ d'un lysat de cellules non infectees (mock) ont 
ete separ<§s sur un gel SDS a 10% de polyacrylamide puis transferes sur une 
membrane de nitrocellulose. Apres blocage dans une solution de PBS/lait 5%/Tween 
0,1% et lavage en PBS/Tween 0,1%, cette membrane a ete hybridee pendant une nuit 
a 4°C avec : (i) l'immun-serum N° 20033168 dilue au 1/300, 1/1000 et 1/3000 dans le 
20 tampon PBS/BSA 1%/Tween 0,1%, (ii) le serum du lapin PI 3097 (serum anti-N) 
dilue au 1/50000 dans le meme tampon et (iii) le s6rum du lapin PI 1 135 (serum anti- 
S) dilue au 1/10000 dans le meme tampon. Apres lavage en PBS/Tween, une hybrida- 
tion secondaire a et6 r6alisee a 1'aide, soit d'anticorps polyclonaux de mouton diriges 
contre les chaines lourdes et legeres des immunoglobulines G humaines et couples a la 
25 peroxidase (NA933V, Amersham), soit d'anticorps polyclonaux d'ane diriges contre 
les chaines lourdes et 16geres des immunoglobulines G de lapin et couples a la 
peroxidase (NA934V, Amersham). Les anticorps fixes ont &e rev616s a 1'aide du kit 
ECL+ (Amersham) et de films d'autoradiographie Hyperfilm MP (Amersham). Une 
echelle de masse moleculaire (kDa) est portee sur la figure. 

30 
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3) Resultats 

La figure 7 montre que trois polypeptides de masse moleculaire appa- 
rente 35, 55 et 200 kDa sont detectes sp6cifiquement dans les extraits de cellules 

infectees par le SARS-CoV. 

5 Afin d'identifier ces polypeptides, deux autres immunoempreintes 

(figure 8) ont &e r6alisees sur les mSmes echantillons et dans les memes conditions 
avec des anticorps polyclonaux de lapins specifique de la nucleoproteine N (lapin 
P13097, figure 8A) et de la proteine de spicule S (lapin PI 1135, figure 8B) Cette 
experience montre que le polypeptide de 200 kDa correspond a la glycoprotein de 

10 spicule S du SARS-CoV, que le polypeptide de 55 kDa correspond a la nucleoproteine 
N tandis que le polypeptide de 35 kDa represente vraisemblablement une forme 

tronquee ou degradee de la N. 

Les donnees pr6sentees dans la figure 7 montrent done que le serum 
20033168 reagit fortement avec la N et beaucoup plus faiblement avec la S du SARS- 

15 CoV, puisque les polypeptides de 35 et 55 kDa sont reveles sous la forme de bandes 
intenses pour des dilutions de 1/300, 1/1000 et 1/3000 de Fimmunserum alors que le 
polypeptide de 200 kDa n'est que faiblement revel6 pour une dilution de 1/300. On 
pent noter egalement qu'aucun autre polypeptide du SARS-CoV n'est detecte pour des 
dilutions superieures au 1/300 du serum 20033168. 

20 Cette experience indique que la reponse en anticorps specifique de 

la N du SARS-CoV domine les reponses en anticorps specifiques des autres poly- 
peptides du SARS-CoV et en particulier la reponse en anticorps dirigee centre la 
glycoprotein S. Elle indique une immunodominance de la nucleoproteine N lors des 
infections humaines par le SARS-CoV. 

25 Exemnle 4 : Preparation d'anticorps polyclonaux monospecifiques diriges centre 
les proteines N et S du coronavirus associe au SRAS (SARS-CoV) 

1) Materiel et methode 

Trois lapins (P13097, P13081, P13031) ont ete immunises avec le 
polypeptide recombinant purifi6 correspondant a 1' integralite de la nucleoproteine (N), 
30 prepar6 selon le protocole decrit a l'exemple 2. Apres une premiere injection de 0,35 
mg par lapin de prot6ine emulsionnee en adjuvant complet de Freund (voie intra- 
dermique), les animaux ont recus 3 injections de rappel a 3 puis 4 semaines 
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d'intervalle, de 0,35 mg de proteine recombinante emulsionn6e en adjuvant incomplet 
de Freund. 

Trois lapins (PI 1135, P13042, P14001) ont ete immunises avec le 
polypeptide recombinant correspondant au fragment court de la proteine S (S c ), 
5 produit comme decrit a Fexemple 2. Comme ce polypeptide est retrouve principale- 
ment sous la forme de corps d'inclusion dans le cytoplasme bacterien, les animaux ont 
recus 4 injections intra-dermiques a 3-4 semaines d'intervalle d'une preparation de 
corps d'inclusion correspondant a 0,5 mg de prot6ine recombinante emulsionnee en 
adjuvant incomplet de Freund. Les 3 premieres injections ont ete realisees avec une 
10 preparation de corps d'inclusion prepares selon le protocole decrit a Fexemple 2, 
tandis que la quatrieme injection a ete realise© avec une preparation de corps 
d'inclusion qui ont ete prepares selon le protocole decrit a 1'exemple 2 puis purifies 
sur gradient de saccharose et laves en 2 % Triton XI 00. 

Pour chaque lapin, un serum pre-immun (p.i.) a ete prepare avant la 
15 premiere immunisation et un immun-serum (IS.) 5 semaines apres la quatrieme 
immunisation. 

Dans un premier temps, la reactivite des serums a ete analysee par 
test ELISA vis a vis de preparations de proteines recombinantes semblables a celies 
utilisees pour les immunisations ; les tests ELISA ont ete realises selon le protocole et 
20 avec les reactifs tels que decrits a 1'exemple 6. 

Dans un deuxieme temps, la reactivite des serums a ete analysee en 
realisant une immunoempreinte (western blot) d'un lysat de cellules infectees par le 
SARS-CoV, en suivant le protocole tel que decrit a Fexemple 3. 
2) Resultats 

25 Les tests ELIS A (figure 9) demontrent que les preparations de 

proteine N recombinante et de corps d'inclusion du fragment court de la proteine S 
(S c ) sont immunogenes chez 1'animal et que le titre des serums immuns est eleve (plus 
de 1/25000). 

L'immunoempreinte (figure 8) montre que le serum immun du lapin 
30 PI 3097 reconnait deux polypeptides presents dans les lysats de cellules infectees par 
le SARS-CoV : un polypeptide dont la masse moleculaire apparente (50-55 kDa selon 
les experiences) est compatible avec celle de la nucleoproteine N (422 r6sidus, masse 
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moleculaire predite de 46 kDa) et un polypeptide de 35 kDa, qui represente vraisem- 
blablement une forme tronquee ou degradee de la N. 

Cette experience montre egalement que le serum du lapin PI 1135 
reconnait principalement un polypeptide dont la masse moleculaire apparente (180- 
5 220 kDa selon les experiences) est compatible avec une forme glycosylee de la S 
(1255 residus, chaine polypeptidique non glycosylee de 139 kDa), ainsi que des poly- 
peptides plus legers, qui represented vraisemblablement des formes tronquees et/ou 

non glycosylees de la S. 

En conclusion, l'ensemble de ces experiences demontrent que des 
1 0 polypeptides recombinants exprimes chez E. coli et corresponds aux prot6ines N et 
S du SARS-CoV permettent d'induire chez r animal des anticorps polyclonaux 
capables de reconnaitre les formes natives de ces proteines. 

E*em D le5 : Preparation d'anticorps polyclonaux monospecifics diriges contre 
les proteines M et E du coronavirus associe au SRAS (SARS-CoV) 
1 5 1) Analyse de la structure des proteines M et E 

a) Proteine E 

La structure de la proteine E du SARS-CoV (76 acides amines) a ete 
analysee in silico , a l'aide de different logiciels comme signalP vl.l, NetNGlyc 1.0, 
THMM 1.0 et 2.0 (Krogh et al., 2001, J. Mol. Biol., 305(3):567-580) ou encore 
20 TOPPRED (von Heijne, 1992, J. Mol. Biol. 225, 487-494). L'analyse montre que ce 
polypeptide non glycosyle est une prot6ine membranaire de type 1, contenant une 
seule helice transmembranaire (aa 12-34 d'apres THMM), et dont la plus grande partie 
du domaine hydrophile (42 residus) est localisee a l'extremite C-terminale et vraisem- 
blablement a l'interieur de la particule virale (endodomaine). On pent noter une inver- 
25 sion dans la topologie predite par les versions 1 .0 (N-ter est externe) et 2.0 (N-ter est 
interne) du logiciel THMM, mais que d'autres algorithmes, notamment TOPPRED et 
THUMBUP (Zhou et Zhou, 2003, Protein Science 12 :1547-1555) confirment une 
localisation externe de l'extremite N-terminale de E. 
b) Proteine M 

30 Une analyse similaire realisee sur la proteine M du SARS-CoV (221 

acides amines) montre que ce polypeptide ne possede pas de peptide signal (d'apres le 
logiciel signalP vl.l) mais trois domaines transmembranaires (residus 15-37, 50-72, 
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77-99 d'apres THMM2.0) et un grand domaine hydrophile (aa 100-221) localise a 
l'interieur de la particule virale (endodomaine). Elle est vraisemblablement glycosylee 
sur l'asparagine en position 4 (d'apres NetNGlyc 1 .0). 

Ainsi, en accord avec les donnees experimentales connues pour les 
5 autres coronavirus, il est remarquable que les deux prolines M et E pr6sentent des 
endodomaines correspondant a la majeure partie des polypeptides et des ectodomaines 
de tres petite taille. 

- Tectodomaine de E correspond vraisemblablement aux residus 1 a 

11 ou 1 a 12 de la proteine: MYSFVSEETGT(L), SEQ ID NO : 70. En effet, la 
10 probabilite associee a la localisation transmembranaire du residu 12 est intermediate 

(0,56 d'apres THMM 2.0). 

- l'ectodomaine de M correspond vraisemblablement aux residus 2 a 
14 de la proteine : ADNGTITVEELKQ, SEQ ID NO : 69. En effet, la methionine N- 
terminale de M est tres probablement clivee du polypeptide mature car le residu en 

15 position 2 est une Alanine (Varshavsky, 1996, 93:12142-12149). 

Par ailleurs, F analyse de Thydrophobicite (Kyte & Doolittle, Hopp 
& Woods) de la proteine E met en evidence que Pextremite C-terminale de 
F endodomaine de E est hydrophile et done vraisemblablement exposee a la surface de 
ce domaine. Ainsi, un peptide synth6tique correspondant a cette extremite est un bon 

20 candidat immunogene pour induire chez Fanimal des anticorps dirigSs contre 
1' endodomaine de E. En consequence, mi peptide correspondant aux 24 residus C- 
terminaux de E a &e synthetise. 

2) Preparation d'anticorps diriges contre rectodomaine des proteines M et E et 
V endodomaine de la proteine E 

25 Les peptides M2-14 (ADNGTITVEELKQ, SEQ ID NO : 69), El- 

12 (MYSFVSEETGTL, SEQ ID NO: 70) et E53-76 (KPTVYVYSRV 
KNLNSSEGVP DLLV, SEQ ID NO : 71) ont ete synthases par Neosystem. lis ont 
ete couples a la KLH (Keyhole Limpet Hemocyanin) a Faide du MBS (m-maleimido- 
benzoyl-N-hydroxysuccinimide ester) via une cysteine ajoutee au cours de la synthese 

30 soit en N-terminal du peptide (cas de E53-76) soit en C-terminal (cas de M2-14 et El- 
12). 
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Deux lapins ont et6 immunises avec chacun des conjugues, en 
suivant le protocole d'immunisation suivant : apres une premiere injection de 0,5 mg 
de peptide couple a la KLH et emulsionne en adjuvant complet de Freund (voie intra- 
dermique), les animaux recoivent 2 a 4 injections de rappel a 3 ou 4 semaines 
5 d'intervalle de 0,25 mg de peptide couple a la KLH et emulsionne en adjuvant 

incomplet de Freund. 

Pour chaque lapin, un serum pre-immun (p.i.) a ete prepare avant la 
premiere immunisation et un immun-serum (I S.) est prepare 3 a 5 semaines apres les 
injections de rappel. 

10 La reactivite des serums est analysee dans un premier temps par test 

ELISA vis a vis du peptide utilise pour rimrounisation, puis par immunoempreinte 
vis-a-vis de lysats de cellules infectees par le SARS-CoV, comme d6crit pour les 
serums anti-N et anti-S de l'exemple 4, selon des protocole similaires a ceux decrits 
aux exemples 3 et 6, respectivement pour l'immunoempreinte et le test ELISA. 

15 Dans un second temps, la reactivite des immunserums diriges 

centre les peptides M2-14 et El-12 a reconnaitre les ectodomaines de M et de E 
presents a la surface de la particule virale native est analysee par des tests 
d'immunocapture et/ou d'immunoprecipitation de virions natifs. 

Excmple 6 : Analyse de la reactivite en ELISA de la protSne N recombinants 
20 vis-a-vis de serums de patients atteints de SRAS 
1) Materiel 

L'antigene utilise pour preparer les phases solides est la nucleo- 
proteine N recombinante purifiee preparee selon le protocole d6crit a l'exemple 2. 

Les serums a tester (Tableau IV) ont ete choisis sur la base des 
25 resultats d'analyse de leur r6activit6 par immunofluorescence (titre IF-SRAS), vis-a- 
vis de lysats de cellules infectees par le SARS-CoV. 
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Tableau IV: Serums testes en ELISA 



Reference 


N p serum 


Type 
de serum 


Date du 
Serum*** 


Titre IF-SRAS 


3050 


A 


Temoin 


na* 


nt** 


3048 


B 


Temoin 


na 


nt 


033168 


D 


Patient 1-SRAS 


27/04/03 (J38) 


320 


033397 


E 


Patient-1 SRAS 


11/05/03 (J52) 


320 


032632 


F 


Patient-2 SRAS 


21/03/03 (J1 7) 


2500 


032791 


G 


Patient-3 SRAS 


04/04/03 (J3) 


<40 


033258 


H 


Patient-3 SRAS 


28/04/03 (J27) 


160 



jours apres le debut des symptdmes de SRAS. 



2) Methode 

La proteine N (100 |Lil) diluee a differentes concentrations dans du 
tampon carbonate 0,1 M, pH 9,6 (1, 2 ou 4 |Lig/ml) est distribute dans les puits de 
plaques ELISA, puis les plaques sont incubees une nuit a temperature du laboratoire. 
Les plaques sont lavtes avec du tampon PBS-Tween, saturees avec du tampon PBS- 
lait ecr6me-saccharose (5 %). Les serums a tester (100 jll!) prealablement dilues (1/50, 
1/100, 1/200, 1/400, 1/800, 1/1600 et 1/3200) sont ajoutes, puis les plaques sont incu- 
bees 1 h a 37° C Apres 3 lavages, le conjugue anti-IgG humaines marque a la peroxi- 
dase (reference 209-035-098, JACKSON) dilue au 1/1 8000 est ajoute puis les plaques 
sont incubees lh a 37 °C. Apres 4 lavages, le chromogene (TMB) et le substrat (H 2 0 2 ) 
sont ajout6s et les plaques sont incubees 30min a temperature ambiante, a Tabri de la 
lumiere. La reaction est ensuite arretee puis Tabsorbance a 450 nm est mesuree a 
Taide d'un lecteur automatique. 

3) Resultats 

Les tests ELISA (figure 10) demontrent que la preparation de 
proteine N recombinante est reconnue sp6cifiquement par les anti corps de serums de 
patients atteints de SRAS prelev6s en phase tardive de Tinfection (> 17 jours apres le 
debut des symptomes) alors qu'elle n'est pas reconnue de fa9on significative par les 
anticorps d'un serum de patient prelev6 en phase precoce de Tinfection (3 jours apres 
le debut des symptomes) ni par des serums temoins de sujets non atteints de SRAS. 
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Exemole 7 : Detection du coronavirus associe au SRAS (SARS-CoV) par RT- 
PCR en temps reel a l'aide d'amorces spScifiques du gene de la nucleoproteine 
1) Mise au point des conditions de la RT-PCR 

a) cnnre ption des amorces e t des sondes 
5 La conception des amorces et sondes a ete realisee a partir de la 

sequence du genome de la souche de SARS-CoV issue du prelevement repertorie sous 

le numero 031589, a l'aide du programme "Light Cycler Probe Design (Roche)". 

Ainsi les deux series d'amorces et de sondes suivantes ont et6 selectionnees : 
- seriel (SEQ ID NO : 60, 61, 64, 65): 
10 - amorce sens : N/+/28507 : 5'-GGC ATC GTA TGG GTT G-3' [28507-28522] 

- amorce antisens : N/-/28774 : S'-CAG TTT CAC CAC CTC C-3' [28774-28759] 

- sonde 1 : 5'-GGC ACC CGC AAT CCT AAT AAC AAT GC-fluoresceine 3' [28561- 

? sonde 2 : 5' Red705 -GCC ACC GTG CTA CAA CTT CCT-phosphate [28588-28608] 
15 -serie2 (SEQ ID NO: 62, 63, 66, 67) 

- amorce sens : N/+/28375 : 5'-GGC TAC TAC CGA AGA G-3' [28375-28390] 

- anwceantisens : N/-/28702 : 5>-AAT TAC CGC GAC TAC G-3' [28702-28687] 

- sonde 1 : SRAS/N/FL : 5'-ATA CAC CCA AAG ACC ACA TTG GC - fluoresce 3' 

- 2 S 8 ondel^fRAS/N/LC705 s 5' Red705 -CCC GCA ATC CTA ATA ACA ATG CTG C- 
phosphate3' [28565-28589] 

h.y anal ysft de l'effinacit.e des de »v ^nptes amorces 

Afin de tester l'efficacite respective des deux couples d'amorces, une 
amplification par RT-PCR a ete realisee sur un ARN synthetique correspondant aux 
nucleotides 28054-29430 du genome de la souche de SARS-CoV issue du preleve- 
ment repertorie sous le numero 03 1 589et contenant la sequence du gene N. 
De maniere plus precise : 

Cet ARN synthetique a ete prepare par transcription in vitro a l'aide 
de 1'ARN polymerase du phage T7, d'une matrice d'ADN obtenu par linearisation du 
plasmide SRAS-N avec l'enzyme Bam HI. Apres elimination de la matrice d'ADN par 
digestion a l'aide de DNAse 1, les ARN synthetiques sont purifies par une extraction 
an phenol-chloroforme suivie de deux pr6cipitations successives en acetate 
d'ammonium et isopropanol. lis sont alors quantifies par mesure de 1'absorbance a 260 
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nm et leur qualite est contrdlee par le rapport des absorbances a 260 et 280 ran ainsi 
que par une electrophorese en gel d'agarose. Ainsi, la concentration de la preparation 
d'ARN synthetique utilisee pour ces etudes est de 1,6 tng/ml, ce qui correspond a 
2,1. 10 15 copies/ml d'ARN. 

5 Des quantites decroissantes d'ARN synthetique ont 6te amplifies par 

RT-PCR a 1'aide du kit "Superscript™ One-Step RT-PCR with Platinum® Taq" et les 
couples d'amorces n° 1 (N/+/28507, N/-/28774) (figure 1A) et n° 2 (N/+/28375, N/- 
/28702) (figure IB), en suivant les indications du fournisseur. Les conditions d'ampli- 
fication utilisees sont les suivantes : l'ADNc a ete synthetise par incubation 30 min a 
10 45 °C, 1 5 min a 55°C puis 2 min a 94 °C puis il a 6t6 amplifie par 5 cycles compre- 
nant : une etape de denaturation a 94°C pendant 15 sec, une etape d'hybridation a 
45°C pendant 30 sec puis une etape d'elongation a 72°C pendant 30 sec, suivis de 35 
cycles comprenant: une etape de denaturation a 94°C pendant 15 sec, une etape 
d'hybridation a 55°C pendant 30 sec puis une etape d'elongation a 72°C pendant 30 
15 sec, avec 2 sec d'elongation suppl6mentaire a chaque cycle, et d'une etape finale 
d'elongation a 72°C pendant 5 min. Les produits d'amplification obtenus ont ensuite 
ete maintenus a 10°C. 

Les resultats presentes a la figure 11 montrent que le couple 
d'amorces n° 2 (N/+/28375, N/-/28702) permet de detecter jusqu'a 10 copies d'ARN 
20 (bande de faible intensity ou 1 0 2 copies (bande de bonne intensit6) contre 1 0 4 copies 
pour le couple d'amorces n° 1 (N/+/28507, N/-/28774). Les amplicons sont respecti- 
vement de 268 pb (couple 1) et de 328 pb (couple 2). 

c) mise au point d e la RT-PCR en temp s r&>1 

Une RT-PCR en temps reel a ete mise au point a l'aide du couple 
25 d'amorces n°2 et du couple de sonde constitue par SRAS/N/FL et SRAS/N/LC705 
(figure 2). 

L'amplification a ete realisee sur un LightCycler™ (Roche) a l'aide 
du kit "Light Cycler RNA Amplification Kit Hybridization Probes » (reference 2 015 
145, Roche) dans les conditions optimisees suivantes. Un Melange reactionnel conte- 
30 nant : H 2 0 (6,8 pi), MgCl 2 25 mM (0,8 pi, 4 pM final de Mg2+), melange reactionnel 
5X (4 ixl), sonde SRAS/N/FL 3pM (0,5 pi, 0,075 pM final), sonde SRAS/N/LC705 3 
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fiM (0,5 nl, 0,075 ^iM final), amorce N/+/28375 10 jiM (1 0,5 pM final), amorce 
N/-/28702 10 \xM (1 |xl, 0,5 jiM final), melange d'enzyme (0,4 pi) et echantillon 
(ARN viral, 5 pi) a ete amplifie en suivant le programme suivant : 

- Transcription inverse : 50°C 10:00min analysis mode: none 

5 - Denaturation : 95°C 30sec xl analysis mode: none 

- Amplification : 95°C 2sec ► 

50°C 15sec analysis mode: quantification *^ x45 

72°C 1 3sec rampe thermique 2,0°C/sec ► 

- refroidissement : 40°C 30sec xl analysis mode: none 

10 *La mesure de fluorescence se fait a la fin de Thybridation et a cbaque cycle (en mode 
SINGLE). 

Les resultats presentes a la figure 12 montrent que cette RT-PCR en 
temps reel est tres sensible puisqu'elle permet de d^tecter 10 2 copies d'ARN 
synthetique dans 100% des 5 echantillons analyses (29/29 echantillons dans 8 expe- 

15 riences) et jusqu'a 10 copies d'ARN dans 100% des 5 ecbantillons analyses (40/45 
echantillons dans 8 experiences). Elle montre egalement que cette RT-PCR permet de 
d&ecter la presence du genome du SARS-CoV dans un echantillon et de quantifier le 
nombre de genomes presents. A titre d'exemple, TARN viral d'un stock de SARS- 
CoV cultiv6 sur cellules Vero E6 a ete extrait a Taide du kit "Qiamp viral RNA 

20 extraction" (Qiagen), dilue a 0,05. 10" 4 et analyse par RT-PCR en temps reel selon le 
protocole decrit ci-dessus; Tanalyse presentee a la figure 12 montre que ce stock de 
virus contient 6,5. 10 9 genomes -equivalents/ml (geq/ml), ce qui est tout a fait 
similaire a la valeur de 1,0.10 10 geq/ml mesuree a Taide du kit "RealArt™ HPA- 
Coronavirus LC RT PCR Reagents" commercialise par Attus. 

25 d) detection de TARN du SARS-CoV par PCR en temps reel a partir de nr&evements 
respiratoires 

Une 6tude comparative a ete realis6e sur une serie de prelevements 
respiratoires rectus par le Centre National de Reference du Virus Influenzae (region 
nord) et susceptibles de contenir du SARS-CoV. Pour ce faire, TARN a 6te extrait des 
30 prelevements a Taide du kit "Qiamp viral RNA extraction" (Qiagen) et' analyse par 
RT-PCR en temps reel, d'une part a Taide des couples d'amorces et de sondes de la 
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serie n° 2 dans les conditions d6crites ci-dessus d'une part, et d'autre part a 1'aide du 
kit "LightCycler SARS-CoV quantification kit" commercialise par Roche (reference 
03 604 438). Les rSsultats sont resumes dans le Tableau ci-dessous. lis montrent que 
18 des 26 prelevements sont negatifs et 5 des 26 pr6tevements sont positifs pour les 
5 deux kits, tandis qu'un prelevement est positif pour le seul kit Roche et deux pour les 
seuls reactifs N M serie2". En outre, pour 3 prelevements (20032701, 20032712, 
20032714) les quantity d , ARN detects sont nettement sup&ieures avec les reactifs 
(sondes et amorces) de la serie n°2. Ces resultats indiquent que les amorces et sondes 
N"s6rie2" sont plus sensibles pour la detection du genome du SARS-CoV dans des 
1 0 prelevements biologiques que celles du kit actuellement disponible. 

Tableau V: Analyse par RT-PCR en temps reel des ARN extraits d'une s6rie de 
prelevements de 5 patients a Taide des couples d'amorces et de sondes de la serie 
n° 2 (N "serie 2") ou du kit "LightCycler SARS-CoV quantification kit" (Roche), 
Le type de prelevement est indique ainsi que le nombre de copies de genome viral 
15 mesurees dans chacun des deux tests. NEG : RT-PCR negative. 



Prelevements n° 


Patient 


Type de prelevement 


KIT ROCHE 


N w serie2 M 


20033082 


K 


nasal 


NEG 


NEG 


20033083 


K 


pharynge 


NEG 


NEG 


20033086 


K 


nasal 


NEG 


NEG 


20033087 


K 


pharynge 


NEG 


NEG 


20032802 


M 


nasal 


NEG 


NEG 


20032803 


M 


expectoration 


NEG 


NEG 


20032806 


M 


nasal ou pharynge 


NEG 


NEG 


20031746ARN2 


C 


pharynge 


NEG 


NEG 


20032711 


C 


nasal ou pharynge 


39 


NEG 


20032910 


B 


nasal 


NEG 


NEG 


20032911 


B 


pharynge 


NEG 


NEG 


20033356 


V 


expectoration 


NEG 


NEG 


20033357 


V 


expectoration 


NEG 


NEG 


20031725 


K 


asp. endotracheale 


NEG 


150 


20032657 


K 


asp. endotracheale 


NEG 


NEG 


20032698 


K 


asp. endotracheale 


NEG 


NEG 


20032720 


K 


asp. endotracheale 


3 


5 


20033074 


K 


selles 


115 


257 


20032701 


M 


pharynge 


443 


1676 


20032702 


M 


expectoration 


NEG 


249 


20031 747ARN2 


C 


pharynge 


NEG 


NEG 


20032712 


c 


inconnu 


634 


6914 


20032714 


c 


pharynge 


17 


223 


20032800 


B 


nasal 


NEG 


NEG 


20033353 


V 


nasal 


NEG 


NEG 


20033384 


V 


nasal 


NEG 


NEG 
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RirvyNmcATIONS 

1 °) Utilisation d'un produit s61ectionne dans le groupe constitue par : 
a) une proteine ou un peptide code par le polynucleotide de sequence 

SEQ ID NO : 1, 

5 b) un anticorps ou un fragment d'anticorps monoclonal ou poly- 

clonal dirige contre ladite proteine ou ledit peptide en a), et 

c) une puce ou un filtre a proteine ou a peptide comprenant la 
proteine ou le peptide en a) ou bien I'anticorps ou le fragment d'anticorps en b), 
pour la preparation d'un reactif de detection et eventuellement de serotypage, d'un 

10 coronavirus associe au SRAS. 

2°) Utilisation selon la revendication 1 , caracterisee en ce que ladite 

proteine est selectionnee dans le groupe constitue par : 

- la proteine S de sequence SEQ ID NO :3 , 

- la proteine E de sequence SEQ ID NO : 14, 
15 . _ la proteine M de sequence SEQ ID NO : 17, 

- la proteine N de sequence SEQ ID NO : 37, et 

- les proteines codees par les ORF : ORFla, ORFlb, ORP3, ORF4 et 
ORF7 a ORF1 1, ORF13 et ORF14 de sequence respectivement, SEQ ID NO : 74, 75, 

10, 12, 22, 24, 26, 28, 30, 33 et 35 . 

3°) Utilisation selon la revendication 1, caracterisee en ce que ledit 

peptide est selectionne dans le groupe constitu6 par : 

a) ^s peptides correspondant aux positions 14 a 1 1 93 et 475 a 1 1 93 

de la sequence en acides amines de la proteine S, 

b) les peptides correspondant aux positions 2 a 14 (SEQ ID NO : 69) 
25 et 100 a 221 de la sequence en acides amines de la proteine M ; et 

c) les peptides correspondant aux positions 1 a 12 (SEQ ID NO : 70) 
et 53 a 76 (SEQ ID NO : 71) de la sequence en acides amines de la proteine E ; et 
les peptides de 5 a 50 acides amine* consecutifs, de preference de 10 a 30 acides 
amines, inclus ou chevauchant partiellement ou totalement la sequence des peptides 

30 tels que definis en a), b) ou c). 
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REVENDICATIONS 

1 °) Utilisation d'un produit selectionne dans le groupe constitue par : 
a) une proteine ou un peptide code par le polynucleotide de sequence 

SEQ ID NO : 1, 

5 b) un anticorps ou un fragment d'anticorps monoclonal ou poly- 

clonal dirige contre ladite proteine ou ledit peptide en a), et 

c) une puce ou un filtre a proteine ou a peptide comprenant la 
proline ou le peptide en a) ou bien l'anticorps ou le fragment d'anticorps en b), 
pour la preparation d'un reactif de detection et eventuellement de serotypage, d'un 
1 0 coronavirus assocte au SRAS. 

2°) Utilisation selon la revendication 1, caracterisee en ce que ladite 
prot&ne est selectionnee dans le groupe constitue par : 

- la proline S de sequence SEQ ID NO :3 , 

- la proteine E de sequence SEQ ID NO : 14, 
15 - la proteine M de sequence SEQ ID NO : 1 7, 

- la proteine N de sequence SEQ ID NO : 37, et 

- les proteines codees par les ORF : ORFla, ORFlb, ORF3, ORF4 
et ORF7 a ORF11, ORP13 et ORF14 de sequence respectivement, SEQ ID NO : 74, 
75, 1 0, 12, 22, 24, 26, 28, 30, 33 et 35 . 

3°) Utilisation selon la revendication 1, caracterisee en ce que ledit 
peptide est selectionne dans le groupe constinte par : 

a) les peptides correspondent aux positions 14 a 1 193 et 475 k 1 193 
de la sequence en acides amines de la proteine S, 

b) les peptides correspondant aux positions 2 a 14 (SEQ ID NO : 69) 
25 et 1 00 a 221 de la sequence en acides amines de la proteine M ; et 

c) les peptides correspondant aux positions 1 a 12 (SEQ ID NO : 70) 
et 53 a 76 (SEQ ID NO : 71) de la sequence en acides amines de la proteine E ; et 

les peptides de 5 a 50 acides amines consecutifs, de preference de 10 a 30 acides 
amines, inclus ou chevauchant partiellement ou totalement la sequence des peptides 
30 tels que definis en a), b) ou c). 

4°) Utilisation selon la revendication 1, caracterisee en ce que ledit 
peptide est constitue de 7 a 50 acides amines consecutifs codes par le polynucteotide 
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4°) Utilisation selon la revendication 1 , caracterisee en ce que ledit 
peptide presente une sequence de 7 a 50 incluant un residu d'acide amine selectionne 
dans le groupe constitu6 par : 

- F alanine situee en position 2552 de la sequence en acides amines 
5 de la proteine cod£e par FORF1 a de la souche isolee de coronavirus telle que d6finie a 

la revendication 1 ou a la revendication 2, 

- la serine situee en position 577 de la sequence en acides amines de 
la proteine S de la souche isolee de coronavirus telle que definie k la revendication 1 
ou a la revendication 2, 

10 - la glycine en position 11 de la sequence en acides amines de 

FORF3 de la souche isolee de coronavirus telle que definie a la revendication 1 ou a la 
revendication 2, et 

- la serine en position 154 de la sequence en acides amines de la 
proteine M de la souche isolee de coronavirus telle que definie a la revendication 1 ou 

15 a la revendication 2. 

5°) Methode de detection d'un coronavirus associe au SRAS, a partir 
d'un echantillon biologique, laquelle methode est caracterisee en ce qu'elle comprend 
aumoins : 

(a) la mise en contact dudit echantillon biologique avec au moins un 
20 anticorps ou un fragment d'anticorps, une proteine, un peptide ou bien une puce ou un 

filtre a proteine ou a peptide tels que definis a Tune quelconque des revendications 1 a 
4,et 

(b) la revelation par tout moyen approprie des complexes antigene- 
anticorps formes en (a). 

25 6°) Methode selon la revendication 5, caracterisee en ce que Fetape 

(a) comprend : 

(ai) la mise en contact dudit echantillon biologique avec au moins un 
premier anticorps ou fragment d'anticorps qui est fixe sur un support approprie, 
notamment une microplaque , 
30 (a 2 ) le lavage de la phase solide, et 



61 

de sequence SEQ ID NO : 1, lequel peptide est selectionne dans le groupe constitue 
par : 

-un peptide comprenant l'alanine situee en position 2552 de la 
sequence en acides amines de la proteine codee par I'ORFl a, 
5 - un peptide comprenant la serine situee en position 577 de la 

sequence en acides amines de la proteine S, 

- un peptide comprenant la glycine en position 1 1 de la sequence en 
acides amines de la proteine codee par l'ORF3, et 

- un peptide comprenant la serine en position 154 de la sequence en 
1 0 acides amines de la prot6ine M. 

5°) Methode de detection d'un coronavirus associe au SRAS, a 
partir d'un echantillon biologique, laquelle methode est caracterisee en ce qu'elle 
comprend au moins : 

(a) la mise en contact dudit echantillon biologique avec au moins un 
1 5 anticorps ou un fragment d'anticorps, une proteine, un peptide ou bien une puce ou un 

filtre a proteine ou a peptide tels que definis a 1'une quelconque des revendications 1 a 
4, et 

(b) la revelation par tout moyen approprie des complexes antigene- 
anticorps formes en (a). 

20 6 °> Methode selon la revendication 5, caracterisee en ce que Petape 

(a) comprend : 

(ai) la mise en contact dudit echantillon biologique avec au moins un 
premier anticorps ou fragment d'anticorps qui est fixe sur un support approprie, 
notamment une microplaque , 
25 le lavage de la phase solide, et 

(a 3 ) l'addition d'au moins un second anticorps ou fragment 
d'anticorps, different du premier, ledit anticorps ou fragment d'anticorps etant even- 
tuellement marqu6 de facon appropriee. 

7°) Kit ou coffret de detection d'un coronavirus associe au SRAS, 
30 caracterise en ce qu'il comprend au moins un reactif selectionne dans le groupe' 
constitue par : une proteine ou un peptide, un anticorps ou un fragment d'anticorps et 
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(a 3 ) 1'addition d'au moins un second anticorps ou fragment 
d'anticorps, different du premier, ledit anticorps ou fragment d'anticorps etant even- 
tuellement marque de facon appropriee. 

7°) Kit ou coffret de detection d'un coronavirus associe au SRAS, 
5 caracterise en ce qu'il comprend au moins un reactif selectionne dans le groupe 
constitue par : une proline ou un peptide, un anticorps ou un fragment d'anticorps et 
une puce ou un filtre a proteine ou a peptide tels que definis a 1'une quelconque des 

revendications 1 a 4. 

8°) Composition immunogene, caracterisee en ce qu'elle comprend 

1 0 au moins un produit selectionne dans le groupe constitue par : 

a) une proteine ou un peptide tels que definis a la revendication 1, 

b) un polynucleotide de type ADN ou ARN ou l'un de ses fragments 
representatifs tels que definis ci-dessus, de sequence choisie parmi : 

(i) la sequence SEQ ID NO : 1 ou son equivalent ARN 
15 (ii) la sequence hybridant dans des conditions de forte stringence 

avec la sequence SEQ ID NO : 1, 

(iii) la sequence complementaire de la sequence SEQ ID NO : 1 ou 
de la sequence hybridant dans des conditions de forte stringence avec la sequence 
SEQ ID NO : 1, 

20 (iv) la sequence nucleotidique d'un fragment representatif du poly- 

nucleotide tel que defini en (i), (ii) ou (iii), 

(v) la sequence telle que definie en (i), (ii), (iii) ou (iv), modifiee, et 
c) un vecteur d'expression recombinant comprenant un 
polynucleotide tel que defini en b), et 
25 d) une banque d'ADNc telle que definie ci-dessus. 

9°) Utilisation d'une proteine ou d'un peptide isole ou purifie 
presentant une sequence s61ectionnee dans le groupe constitue par les s6quences SEQ 
ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 33, 35, 37, 69, 70, 71, 74 et 75 pour 
former un complexe immun avec un anticorps dirig6 specifiquement contre un epitope 
30 du coronavirus associe au SRAS. 

10°) Complexe immun forme d'une proteine ou d'un peptide isole 
ou purifie presentant une sequence selectionnee dans le groupe constitue par les 



62 

une puce ou un filtre a proline ou a peptide tels que d6finis a l'une quelconque des 
revendications 1 a 4. 

8°) Composition immunogene, caracterisee en ce qu'elle comprend 
au moins un produit s&ectionne dans le groupe constitue par : 
5 a) une proline ou un peptide tels que dermis a la revendication 1, 

b) un polynucleotide de type ADN ou ARN ou l'un de ses fragments 
repr<5sentatifs, de sequence choisie parmi : 

(i) la sequence SEQ ID NO : 1 ou son equivalent ARN 

(ii) la sequence hybridant dans des conditions de forte stringence 
1 0 avec la sequence SEQ ID NO : 1 , 

(iii) la sequence complementaire de la sequence SEQ ID NO : 1 ou 
de la sequence hybridant dans des conditions de forte stringence avec la s6quence 
SEQ ID NO : 1, 

(iv) la sequence nucleotidique d'un fragment representatif du poly- 
15 nucleotide tel que defini en (i), (ii) ou (iii), 

(v) la sequence telle que definie en (i), (ii), (iii) ou (iv), modifiee, et 

c) un vecteur depression recombinant comprenant un 
polynucleotide tel que defini en b), et 

d) une banque d'ADNc telle que definie ci-dessus. 

20 9 °) Utilisation d'une proline ou d'un peptide isote ou purifte 

presentant une sequence selectionnee dans le groupe constitue par les sequences SEQ 
ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 33, 35, 37, 69, 70, 71, 74 et 75, in vitro, 
pour former un complexe immun avec un anticorps dirig6 specif quement contre un 
epitope du coronavirus assocte au SRAS. 

25 1 °°) Co^Plexe immun forme d'une proteine ou d'un peptide isol6 ou 

purine presentant une sequence selectionnee dans le groupe constitue par les 
sequences SEQ ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 33, 35, 37, 69, 70, 71, 74 
et 75, et d'un anticorps dirige specifiquement contre un epitope du coronavirus associe 
au SRAS. 

30 n °> Utilisation d'une proteine ou d'un peptide isol<§ ou purify 

presentant une sequence selectionnee dans le groupe constitue par les sequences SEQ 
ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 33, 35, 37, 69, 70, 71, 74 et 75, pour la 
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une puce ou un filtre k proteine ou h peptide tels que definis a Tune quelconque des 
revendications 1 a 4. 

8°) Composition immunog&ie, caracterisee en ce qu'elle comprend 
au moins.un produit selectionne dans le groupe constitue par : 
5 a) une proline ou un peptide tels que definis a la revendication 1, 

b) un polynucleotide de type ADN ou ARN ou Tun de ses fragments 
representatifs, de sequence choisie parmi : 

(i) la sequence SEQ ID NO : 1 ou son equivalent ARN 

(ii) la sequence hybridant dans des conditions de forte stringence avec la 
1 0 sequence SEQ ID NO : 1 , 

(iii) la sequence compiementaire de la sequence SEQ ID NO : 1 ou de la 
sequence hybridant dans des conditions de forte stringence avec la sequence SEQ ID 
NO: 1, 

(iv) la sequence nucleotidique d'un fragment representatif du poly- 
15 nucleotide tel que defini en (i), (ii) ou (iii), 

(v) la sequence telle que definie en (i), (ii), (iii) ou (iv), modifiee, et 

c) un vecteur d' expression recombinant comprenant un polynucleotide tel 
que defini en b), et 

d) une banque d' ADNc comprenant un polynucleotide tel que defini en b). 
20 9°) Utilisation d'une proteine ou d'un peptide isole ou purifie 

presentant une sequence selectionnee dans le groupe constitue par les sequences SEQ 
ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 33, 35, 37, 69, 70, 71, 74 et 75, in vitro, 
pour former un complexe iromun avec un anticorps dirige specifiquement contre un 
epitope du coronavirus associe au SRAS. 
25 1 0°) Complexe immun forme d'une proteine ou d'un peptide isole ou 

purifie presentant une sequence selectionnee dans le groupe constitue par les 
sequences SEQ ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 33, 35, 37, 69, 70, 71, 74 
et 75, et d'un anticorps dirige specifiquement contre un epitope du coronavirus associe 
au SRAS. 

30 11°) Utilisation d'une proteine ou d'un peptide isole ou purifie 

presentant une sequence selectionnee dans le groupe constitue par les sequences SEQ 
ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 33, 35, 37, 69, 70, 71, 74 et 75, pour la 
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sequences SEQ ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 33, 35, 37, 69, 70, 71, 74 
et 75, et d'un anticorps dirig6 sp6cifiquement contre un epitope du coronavirus associe 
au SRAS. 

11°) Utilisation d'une proteine on d'un peptide isole ou purifie 
5 pr6sentant une sequence s61ectionn£e dans le groupe constitu6 par les sequences SEQ 
ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 33, 35, 37, 69, 70, 71, 74 et 75 pour 
induire la production d'un anticorps capable de reconnaitre specifiquement un epitope 
du coronavirus associe au SRAS. 

12°) Utilisation d'un polynucleotide isol6 ou purifie presentant une 
1 0 sequence s61ectionnee dans le groupe constitu6 par les sequences SEQ ID NO : 1 , 2, 4, 
7, 8, 13, 15, 16, 18, 19, 20, 31, 36 et 38 pour induire la production d'un anticorps 
dirige contre la proteine codee par ledit polynucleotide et capable de reconnaitre 
specifiquement un Epitope du coronavirus associd au SRAS 
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pr6paration d'une composition immunogene apte a induire la production d'un 
anticorps capable de reconnaitre specifiquement un epitope du coronavirus associe au 
SRAS. 

12°) Utilisation d'un polynucleotide isole ou purifie presentant une 
sequence selectionnee dans le groupe constitue par les sequences SEQ ID NO : 1, 2, 4, 
7, 8, 13, 15, 16, 18, 19, 20, 31, 36 et 38, pour la preparation d'une composition 
immunogene apte a induire la production d'un anticorps dirige contre la proteine 
cod6e par ledit polynucleotide et capable de reconnaitre specifiquement un epitope du 
coronavirus associe au SRAS. 
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TTGGTGTCAA CGAGAAAACA CACGTCCAAC TCAGTTTGCC TGTCCTTCAG GTTAGAGACG TGCTAGTGCG 
290 300 310 320 330 340 350 



FIGURE 13.1 



1er depot 



>< 



>< Mnll 
>< Ksp632I 
Hinfl 
>< Earl 
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>< Sau96I 
>< PssI 
>< Pall 
>< NspIV 
>< Mnll 
>< Haelll 
>< Eco0109I 
>< Drallx MboII 
>< Cfrl3I 

>< BsuRI > 
>< BsiZIX EcoNI 
X BshI X BslI 



>< Pmll 
>< PmaCI 
< Maell 
X Eco72I 
>< BsaAI 



X Plel X Eamll04I>< Asul >< BsiYIX BbrPI >< MnlX 

TGGCTTCGGG GACTCTGTGG AAGAGGCCCT ATCGGAGGCA CGTGAACACC TCAAAAATGG CACTTGTGGT 
360 370 380 390 400 410 420 



X Tru9l 

>< RmaI >< Csp6I x BspWI >< Msel 

>< Mael X Alul >< Mal >< AluI P M * e * 

CTAGTAGAGC TGGAAAAAGG CGTACTGCCC CAGCTTGAAC AGCCCTATGT GTTCATTAAA CGTTCTGATG 
430 440 450 460 470 . 480 490 



X Tru9I 
>< Msel 
>< Esp4I 
X Aflll 



X Pall 
>< Haelll 
>< Gdill 
x Eael 
>< BsuRI 
X BshI 



>< Alul 



>< Rsal 
Mcrl X 
>< Csp6l 
>< BsmI BsiEI X 
>< BscCI >< Afal 



CCTTAAGCAC CAATCACGGC CACAAGGTCG TTGAGCTGGT TGCAGAAATG GACGGCATTC AGTACGGTCG 
500 510 520 530 540 550 560 



>< Acil 



>< Seal 
>< Rsal 
> < Csp6I 
x BsrI 

>< Afal 



X Nspl 
X NspHI 
X Nlalll 
X BslI 
X BsiYI 
X Afllll 



X Muni 



X MboII 
>< MboII 
>< Acil 



TAGCGGTATA ACACTGGGAG TACTCGTGCC ACATGTGGGC GAAACCCCAA TTGCATACCG CAATGTTCTT 
570 580 590 600 610 620 630 

X TthHB8l 

X TaqI 
X Sau3AI 
>< Ndell 
X Mbol 
X DpnII 

> < Dpnl 
x Clal 

X Bsul5I 
X BspDI 
X BspAI 

> < Bspl43l 
X Bspl06I 

x BsiXI Maelll > 

>< BsclX SfaNI Ddel X 
>< Banlll Bfrl x 



X NlalV 
x Mspl 
x Hpall 
X HapII 
x CfrlOI 

>< BscBI 



X Alul 



CTTCGTAAGA ACGGTAATAA GGGAGCCGGT GGTCATAGCT ATGGCATCGA TCTAAAGTCT TATGACTTAG 
b4U 650 660 670 680 690 700 



T?T<"iT TO T? n i 
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>< 



>< 



>< 
Alul 



>< Sau3AI 
>< Ndell 
>< Mbol 
HphI 

>< DpnII 
X BspAI 
AlwIX Dpnl 

>< Bspl4 3I 



>< Mbol I >< 



>< 
BsrI 



Ddel 



Vnel >< 
Snol >< 
> < Nlalll 
ApaLI >< 
Alw4 4I X 



GTGACGAGCT TGGCACTGAT CCCATTGAAG ATTATGAACA AAACTGGAAC ACTAAGCATG GCAGTGGTGC 



710 



720 



>< 
>< 
X 
>< 



730 

SstI 
Sdul 
Sad 
NspII 



740 



750 



760 



>< Mnll 
X HgiAI 
Sdul >< Eco24I 

NspII >< Ecll36II > 

HgiAI >< Bspl286I > 

X Drain >< Bmyl 

Bspl286I >< Banll 

Bmyl >< Alw21I 

Alw21I >< Alul >< Maelll 

ACTCCGTGAA CTCACTCGTG AGCTCAATGG AGGTGCAGTC ACTCGCTATG 
780 790 800 810 820 



>< 
X 
>< 

>< 
X 
X 



>< TthHB8I 
>< TaqI 

< Sail 

< Rtrl 

>< Hindll 
>< Hindi 
>< Bsgl 
>< AccI 
TCGACAACAA 
830 



Sau96I >< 
Pall >< 
NspIV >< 
Haelll >< 
Cfrl3I >< 
BsuRI >< 
BsiZI >< 
BshI >< 
Asul >< 
TTTCTGTGGC 
840 



> < Rsal 

> < NlalV 

>< Kpnl 
X Eco64I 
>< Csp6I 

> < BscBI 
>< BanI 

>< Asp718 

> < Afal 
>< AccBlI 
>< Acc65I 

CCAGATGGGT ACCCTCTTGA 
850 860 



>< Thai 
>< Thai 

>< Mvnl 
>< Mvnl 
>< HinPlI 
>< Hin6I 

>< Hhal 

>< Cfol 

>< BstUI 
>< BstUI 

X BspSOI 
>< BspSOI 

>< Acil 

>< AccII 
>< Mnll >< SfaNI >< AccII 

TTGCATCAAA GATTTTCTCG CACGCGCGGG CAAGTCAATG TGCACTCTTT 
870 880 890 900 910 



> < Vnel 

> < Snol 

>< Sdul 
NspII >< 
HgiAI >< 
Bspl286I >< 

>< Bmyl 

> < ApaLI 

> < Alw44I 
Alw21I >< 



>< TthHB8I 
>< TthHB8I 

>< TaqI 
>< TaqI 

>< Mnll 
>< Ksp632I 
>< HinfIX Plel 

x Eamll04I >< MboII >< Maelll 

>< Earl > < BbvIX AccI >< Fnu4HI 



Nlalll >< 
>< Nlalll 

EcoRII >< 
DsaV >< 



CCGAACAACT TGATTACATC GAGTCGAAGA GAGGTGTCTA CTGCTGCCGT GACCATGAGC ATGAAATTGC 
920 930 940 950 960 970 980 

X TthHB8I 
X TaqI 
>< Sful 

X NspVX Tru9I 
>< HinPlI >< *spl>< Msel 



>< ScrFI 



FIGURE 13.3 
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>< Mval 
>< Ecll36I 
>< BstOI 
>< BstNI 
>< BsiLI 



>< Hin6I 
>< Hhal 
>< Haell 
>< Eco47III 
>< Cfol 



>< Sdul 
>< NspII 
>< HgiAI 
>< Bspl286l 

>< Bmyl 

>< Apyl >< Ddel X Bspl43II X Alul >< Alw21I >< a.uTT 

CTGGTTCACT GAGCGCTCTG ATAAGAGCTA CGAGCACCAG ACACCCTTCG AA^TAAGAG TGCCAAGAAA 
1000 1010 1020 1030 1040 1050 



>< Csp45I 
X BstBI 
X Bspll9I 
X BsiCI 
X Bpul4I 
x AsuII 



>< Tru9I 
>< BsmI >< Msel 

>< BscCI > < Mn 1 T 

TTTGACACTT TCAAAGGGGA ATGCCCAAAG TTTGTGTTTC CTCTTAACTC AAAAGTCAAA GTCATTCAAC 



1090 



1100 



1110 



1120 



1060 

>< Pmll 
>< PmaCI 
>< Maell 
X Eco72I 

see 

>< Afim >< ^ Ddel >r A cci 11071 > u c sii 

CACGTGTTGA AAAGAAAAAG ACTGAGGGTT TCATGGGGCG TATACGCTCT GTGTACCCTG TTGCATCTCC 

>< SfaNI 

>< Maelll >< AccI 

ACAGGAGTGT AAGAATATGC ACTTGTCTAC CTTGATGAAA TGTAATCATP GC6ATGAAGT TTCATGGCAG 

X ^^° 1230 1240 1250 1260 

>< SinI 
X Sau96I 
PssI >< 
>< PspSII 
X PpuMI 
>< NspIV 

X NspHII 
X Eco47l 
X Drall 
x Cfrl3I 
>< BsiZI 
>< Bmel8I 
>< Avail 

X Maell >< Asul 

agg™ TTCT gaaagg cagttgtgaa gattgtggga gtgaaaattt agt E ?S ££S£ 



>< Rsal 
X Nspl 

x NlalV 
>< Nlalll 
X NspHlX Kpnl 
X Eco64I 
X Csp6I 
>< BscBI 
>< BanI 
X Asp718 
X Afal 
>< AccBlI 



Van91I >< 

SinI X 
Sau96I >< 
PflMI >< 
NspIV >< 
NspHII > 
Eco47l >< 
Cfrl3l >< 
BslI x 
BsiZI X 
BsiYI X 
Bmel8I X 
Avail X 
Asul X 



18/83 



_ a „ fi c T X Sfcl >< Nlalll AccB7I X 

CATGTGGGTA CCTACCTACT AATGCTGTAG TGAAAATGCC ATGTCCTGCC TGTCAAGACC CAGAGATTGG 



>< TthHB8I 
>< TaqlX Mnll 
>< Hinfl 
>< Plel >< Acil 

acSgagSt agtgttgcag attatcacaa ccactcaaac attgaaactc gactccgcaa gggaggtagg 

1410 1420 1430 1440 1450 1460 14 /u 

NlalV >< 

>< Rmal >< BsrI 

^ M^T Mn11 >< Bbvl >< Fnu4HI BscBI >< 

actaga?gtt ttggaggctg tgtgtttgcc tatgttggct gctataataa gcgtgcctac tgggttcctc 

1480 1490 1500 1510 1520 1530 li>4U 

XhoII >< 
Sau3AI >< 
Ndell >< 
Mfll >< 

>< Maelll Mbol >< 

>< Pall >< Eco31I DpnII >< 

>< Haelll >< BsrI >< Mnll Dpnl > 

>< r^a! >< BsuRI >< BsrI >< BsmAI BstYI >< 

X Mali • > < Ddel >< BspWI >< BsalX HphI BspAI X 

>< M ael >< Bshix Bgll >< Alw26I Bspl43I > 

gtgctagtgc tgatattggc tcaggccata ctggcattac tggtgacaat gtggagacct tgaatgagga- 

1550 1560 1570 1580 1590 1600 lblU 

> < Tru9I 

> < Msel 

X Maell >< Tru9I 

X Hpal > < Mnl1 

X Hindll > < Ksp632I 

X Hinfl x Plel X Hindi > < * ar * ^ 

* >< Alwl X Ddel X AflHI X Msel > < Eamll04I 

tctccttgag atactgagtc gtgaacgtgt taacattaac attgttggcg attttcattt gaatgaagag 

1620 1630 1640 1650 1660 1670 lb«U 

, „ Plel >< 

X MboII HinfT 
X BstXI X SfaNI > K Hinrj - 

gttgccatca ttttggcatc tttctctgct tctacaagtg cctttattga cactataaag agtcttgatt 

1690 1700 1710 1720 1730 1740 1750 

X Styl 
X Maelll 

X EcoT14I 
X Plel >< Ecol30I 

X Maelll >< BssTlI BslI >< 

X HinfIX Acil >< BsaJI BsiYl >< 

ACAAGTCTTT CAAAACC AT T GTTGAGTCCT GCGGTAACTA TAAAGTTACC AAGGGAAAGC CCGTAAAAGG 
1760 1770 1780 1790 1800 1810 

>< Sau3AI X Van91I 

X Ndell >< PflMI 

X Mbol X Drain 

X DpnII >< BslI 

X Dpnl >< Tru9I >< BsiYI 
X BspAI >< Msel >< Bbvl >< Mnll 

X Bspl4 3I >< AccB7I Fnu4HI X 



FIGURE 135 
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TGCTTGGAAC ATTGGACAAC AGAGATCAGT TTTAACACCA CTGTGTGGTT TTCCCTCACA GGCTGCTGGT 
1830 1840 "SO I860 1870 1880 1890 

>< Thai 
>< SfaNI 
>< Mvnl 
>< HinPlI 
>< HinPlI 

>< Hin6I 
>< Hin6I 

>< Hhal 
>< Hhal 

>< Cfol 
>< Cfol 
>< BstUI 
>< BssHII 

>< Bsp50I 
>< AccII 



>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 

>< Dpnl 
>< BspAI 

>< Bspl43I 



>< Fnu4HI >< Bbvl 



PvuII > 
PspSl > 
NspBII > 
HphI >< 
Fnu4HI >< 
Alul > 



GTTATCAGAT CAATTTTTGC GCGCACACTT GATG CAGCAA ACCACTCAa/tcCTGATTTG CAAAGAGCAG 

>< TthHB8I 

>< Styl 
>< Ncol 
>< Hindu 
>< Hindi 
>< Hinll 

>< EcoT14I 
>< Eco57I 
>< TaqlX Ecol30I 
>< Sail >< Dsal 
>< Rtrl >< BssTlI 
>< BsaHI 

X Maelll ><C BbiII> < Nlalll 

X Bbvl ><C AcyI >< H ^ aI 

CTG.CAGCAJ RCTTC „C=J ATTTCTGAAC AGTCATTACG^TCTTGTCGAC^CCATGGTTT ATACTTCAGA 
1980 1990 2000 2010 2020 2030 

>< Rsal 

X BspMI >< NdeI > < Csp6T 

GG^CAGC AACAGTGTCA TTATTATGGC TACAACAGAC r£S£. 

>< StuI 
>< Pall 
>< Haelll 
>< Ecol47I 
x Ddel 

>< BsuRI 
X BshI 
x AatI 



x Sdul 
X NspII 
X Bspl286I 
>< Bmyl 



Ddel X 
Bfrl X 



TTGTCTAATC TTTTGGGCAC TACTGTTGAA AAACTCAGGC CTATCTTTGA iSStJJJ GCGAAACTTA 

>< Tfil 

>< SfaNI >< Bsgl > >< H F ; 2kI Tthllll >< 

GTGCAGGAGT TGAA TT TGTG AAGGATGCTT GGGAGATTCT GAAATT.CTG ATTACAGGTG T^GACAT 
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Tru9I >< 
Msel >< 
Hpal > 
Hindll > 
Hindi > 

CGTCAAGGGT C^ATACAGG TTGCTTCAGA TAACATCAAG GATTGTGTAA AATGCTTCAT TGATGTTGTT 



2250 



2260 



X TthHB8I 
>< TaqI 
AACAAGGCAC TCGAAATGTG 
2320 2330 



>< HphI 



2270 



2280 



2300 



>< 
>< 
>< 



Sau3AI 
Ndell 
Mbol 

> < Maelll 
>< Fbal 
>< DpnII 

>< Dpnl 
>< BspAI 

>< Bspl43I 
>< BsiQI 
>< Bell 



>< 



>< HinPlI 
>< Hin6I 
>< Hhal 

_ Jt AJ >< Cfol 

CATTGATCAA GTCACTATCG CTGGCGCAAA GTTGCGATCA CTCAACTTAG 
2340 2350 2360 2370 2380 



>< Sau3AI 
>< Ndell 
>< DpnII 

>< DpnIMboII 
Ddel >< 
>< Bspl43I 
>< MboIBfrl >< 
>< BspAI Bbsl >< 



>< DrdI 



>< Maell 
>< Bstll07I 
>< BsaAI 
>< Bbvl 
>< AccI 



>< PvuII 
>< Psp5I 
>< NspBII 
Fnu4HI >< 

> < Fnu4HI 
>< Alul 



GTGAAGTCTT CATCGCTCAA AGCAAGGGAC TTTACCGTCA GTGTATACGT GGCAAGGAGC AGCTGCAACT 
2390 2400 2410 2420 2430 2440 2450 



>< Tru9I 

X NlalV 
>< Msel 

>< Mnll „ 
_ y> t >< Seal 

><C Es P 41 >< Rsa i 

X Eco64I >< RsaI 

>< BscBI >< NlalHMnll >< 

x Nlalll X Banl ^r^T 
X Aflll ><C Tfl3C Csp6I 

X Bbvl ' ^ >< AccBlI >< Maelll >< Hinf I >< HphI >< Afal 

ACTCATGCCT CTTAAGGCAC CAAAAGAAGT AACCTTTCTT GAAGGTGATT CACATGACAC AGTACTTACC 

2460 2470 2480 2490 2500 2510 2520 

> < Xhol 

X TthHB8I 
>< TthHB8IX TaqI 

> < Slal 

> < PaeR7I 

> < NspIII 

X HphI >< Hinll 

> < Eco88I 

> < Ccrl 

X Esp3I X BsaHI 

> < Bcol 

>< BsmAI >< Bbill 

> < Aval >< Hgal 
X TaqI > < Ania87lX BsmBI 

>< DdelX Mnll >< Alw26I >< Acyl X Alul 

TCTGAGGAGG TTGTTCTCAA GAACGGTGAA CTCGAAGCAC TCGAGACGCC CGTTGATAGC TTCACAAATG 
" 2530 2540 2550* 2560 2570 2580 2590 



FIGURE 13.7 
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>< Pall >< Nlalll 
>< Haelll >< Mnll 
>< BsuRI >< Ddel X Tru9I 
>< Alul >< BsrI >< BshI >< Bfrl >< Msel 

GAGCTATCGT TGGCACACCA GTCTGTGTAA ATGGCCTCAT GCTCTTAGAG ATTAAGGACA AAGAACAATA 



2600 



2610 



2620 



2630 



2640 



2650 



2660 



>< ScrFI 
>< Mval 
>< EcoRII 
>< MstI >< Ecll36I 

>< HinPlI >< DsaV 
>< Hin6I >< BstOI 

>< Hhal >< BstNI 
>< Fspl >< BsmAI 

X Fdill X BsiLI 

>< Cfol >< Apyl 
>< Avill >< Alw26I >< BsrI 
CTGCGCATTG TCTCCTGGTT TACTGGCTAC AAACAATGTC 
2670 2680 2690 2700 



>< Vnel 

Tru9I >< 
>< Snol 

>< Sdul 
>< NspII 
Msel >< 
>< HgiAI 
Bspl286I XBslI X 
BsiYI X 
>< Bmyl 
>< ApaLI 
>< Tru9I X Alw4 4I 
X Msel X Alw21I 

TTTCGCTTAA AAGGGGGTGC ACCAATTAAA 
2710 2720 2730 



X Tfil 

>< Maelll >< MboII > < Maelll x Hinfl Alul >< 

GGTGTAACCT TTGGAGAAGA TACTGTTTGG GAAGTTCAAG GTTACAAGAA TGTGAGAATC ACATTTGAGC 



2740 



2750 



2760 



2770 



2780 



2790 



2800 



x Maell 

>< 
x 

X AflHI 



Hindll 
Hindi 



x 

X 



Tru9I 
Msel 



x Sdul 
X NspII 
>< HgiAI 
>< Bspl286I 
>< Bmyl 
>< Alw21I 

X AccI 



X Tfil 
> 
> 

X Hinfl 



X Rsal 
X NlalV 
Maelll x 
X MspIX Kpnl 
X Hpall 
>< HapII 

> < Eco64I 
>< Csp6I 
X BscBI 

< BanI 

< Asp718 
>< Afal 



> < AccBlI 

> < Acc65I 



TTGATGAACG TGTTGACAAA GTGCTTAATG AAAAGTGCTC TGTCTACACT GTTGAATCCG GTACCGAAGT 
2810 2820 2830 2840 2850 2860 2870 



X Sau3AI 
>< Ndell 
X Mbol 
X DpnII 

>< Ns P* > < Dpnl 

X NspHI >< MboII X BspAI 

x Nlalll > < BsrI > < Bspl43l 

>< Ddel X Mnll X AlwNI x Bbsl >< AlwNI 

TACTGAGTTT GCATGTGTTG TAGCAGAGGC TGTTGTGAAG ACT T T ACAAC CAGTTTCTGA TCTCCTTACC 
2880 2890 2900 2910 2920 2930 2940 

>< Sau3AI 
X Ndell 
>< Mbol 
>< DpnII 

>< Dpnl 
>< BspAI 
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^r^c?^?^^ gxaggtS tctacttatt^tgatgrtgct ggtgaagaaa 

X SfaNI 
>< Mnll 

AC?^C SSS 3£c=», KxScSE TG^-GGACGAxf SLcTGTGA 

> < Rsal 
>< Rsal 
>< Nlalll 

X Mnll >< Fokl 

>< Csp6I Eco31I >< 

>< Csp6I >< MamI BsmAI >< 



>< Mboll > < Afal >< BsiBI Bsal >< 

>< MboII >< Afal >< BsaBIAlw26I X 

GGAAGAAGAA ATTGATGAAA CCTGTGAACA TGAGTACGGT AC AGAGG AT G AT T ATCAAGG TCTCCCTCTG 



X NlalVX PvuIIX XmnI 
X Eco64I X PspSI >< TthHB8I 

^ Mnl T x Ddel >< TaqI >< Mnll >< MboII 

X Mnll X Ddel *<*H Ksn632I >< MboII X MboII 

X BscBIX NspBII >< Mnll >< Kspb^x ^ * „ T 

x BanI >< Mnll >< Earl >< BsrI 

w ArrRH X Alul X AspVOOI >< Eamll04I X MboIIX Bbsl 
GAATTTGGTG CCTCAGCTGA AACAGTTCGA GTTGAGGAAG AAGAAGAGGA AGACTGGCTG GATGATACTA. 

3160 3170 3180 3190 3200 3210 J ^ zu 

>< Tru9I 

X Msel >< Eco57I 

X Fokl ><; BsrI>< MboII BsrI X 

CTGAGCAATC AGAGATTGAG CCAGAACCAG AACCTACACC TGAAGAACCA GTTAATCAGT TTACTGGTTA 
3230 3240 3250 3260 3270 3280 

t qf >< Mnll 

^el >< Tru9I >< Hindlix Tru9I >< Dralll 

tr nllr >< Msel >< Hinclix Msel >< BspWI 

ttXa^St actgacaatg ttgccattaa atgtgttgac atcgttaagg aggcacaaag tgctaatcct 

3300 3310 3320 3330 3340 3350 aw 

X Vnel 
X Snol 

> < Sdul 

> < NspII 

> < HgiAI 

> < Bspl286I 

> < Bmyl 
X ApaLI 

> < STsJmI ~ A > < 4 Ilw21I 

ATGGTGATTG TAAATGCTGC^AACATACAC CTGAAACATG GTGGTGGTGT AGCAGGTGCA CTCAACAAGG 
3370 3380 3390 3400 3410 3420 JSJU 

>< Sau96I 
>< Pall 
. . >< NspIV 

>< Haelll 

>< Nlaiv >< Cfr131 

FIGURE 13.9 
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>< Eco64I 

>< BscBI 
>< BanI 

>< AccBllx Nlalll 



>< BsuRI 

> < Tru9I >< BsiZI 

> < Msel >< BshI >< Mnll 
>< Alul >< Asul >< Mnll 



. CAACCAATGG TGCCATGCAA AAGGAGAGTG ATGATTACAT TAAGCTAAAT GGCoSScTTO CAGTAGGAGG 
3440 3450 3460 3470 3480 3490 3500 

>< SinI 
>< Sau96I 
>< NspIV 

>< NspHlX NspHII 
>< Eco4 7I 
>< Cfrl3I 

X Nlalll x BspMI 
X BsiZI 
>< Bmel8I 
X Avail Mnll x 

GTCTTGTTTG CTTTCTGGAC ATAATCTTG^ ^GTGT CTGCATG^^^ 

3510 3520 353 ° 3540 3550 3560 3570 

> < Tru9I 
>< Hphl> < Msel 
>< Esp4I 
X Alul > < Ndel 

>< Afllix Fnu4HI >< Bbvl 

ggtgaggaca tccagcttct taaggcagca tatgaaaatt tcaattcaca ggacatctta cttgcaccat 

3580 3590 36 °0 3610 3620 3630 3640 

Rsal >< 

><r p^t=-7 T Csp6I X 

>< Eco57I >< r cct t 

TGTTGTCAGC AGGCATATTT GGTGCTAAAC CACTTCAGTC TTTACAAGtI TGCGTGCAGA CGgScgSc 
Jtou 3660 3670 3680 3690 3700 3710 

>K Bs< 3 X >< BspMI 

>< Bcgl/a >< Alul H . TTT 

ACAGGTTTAT ATTGCAGTCA ATGACAAAGC TCTTTATGAG CAGGTTGTCA TGGATTATCT TGATAACCTG 
3720 3730 3740 3750 3760 3770 3780 

AAGCCTAGAG T ™c C TAAACAAGAG ™ fl c™* SS^jjj 



X Rsal 
X Csp6I 
>< Afal 



X 
X 



TthHB8I 
TaqI 



>< Tru9I 
X 
X 

>< Msel 

X 
X 
X 
X 
X 



StuI 
Pall 

>< Mnll 
Haelll 
Ecol47I 
BsuRI 
BshI 
AatI 



CTGTCGTACA gaagcctgtc gatgtgaagc caaaaattaa ggcctgcatt 

3860 3870 3880 3890 3900 



X Maelll 
X Eco0651 
X Eco91I 

BstXI >< 
X BstPI 
X BstEII 
GATGAGGTTA CCACAACACT 
3910 3920 



>< Ddel 



X EcoRV 



Tfil >< 
Nlalll X 
Hinfl >< 
>< Hindlll 
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o t -»<r MhnTT >< Maelll >< Eco32I >< Alul 

GGAAGAAACT AAGTTTCTTA CCAATAAGTT ACTCTTGTTT GCTGATATCA ATGGTAAGCT TTACCATGAT 
3930 3940 3950 3960 3970 3980 Jaso 

>< Nspl 
>< NspHI 

>< Nlalll >< sfaNI 

•xr Mnll > < EcoNI 

>< Ddel >< Mboll >< BslI > < Nlalll 

n ripl >< Bfrl >< HphI >< BsiYI >< Fokl 

TCTCAGAACA TGCTTAGAGG TGAAGATATG TCTTTCCTTG AGAAGGATGC ACCTTACATG GTAGGTGATG 
4000 4010 4020 4030 4040 4050 4050 

>< Spel 

RmaI ■><: <?faNT 

>< Mael >< EcoRVX HphI >< SfaNI 

H hi >< Eco32I ><: Mnl1 >-< DdeI 

T TAT C ACT AG TGGTGATATC ACTTGTGTTG TAATACCCTC CAAAAAGGCT GGTGGCACTA CTGAGATGCT 

4070 4080 4090 4100 4110 4120 41.5U 

>< ScrFI 
>< Rsal 

>< Mval 
>< EcoRII 

X EC1136I 
>< DsaV 
>< Csp6I >< EcoNI 
>< BstOI 
X BstNI 
>< BsiLI 
>< BsaJI 
>< BsaAI >< BslI 
>< Mboll >< Maelix Apyl 

A1 j ><: BsrI ><c Afal >< BsiYI 

CTCAAGAGCT T TG AAG AAAG TGCCAGTTGA T G AGT AT AT A ACCACGTACC CT GG AC AAGG ATGTGCTGG|, 
4140 4150 4160 4170 4180 4190 4200 

>< Tru9I 
>< Msel 

>< Ddel >< Es P 4I >< Rs ^ 

>< Mnll >< BspWI >< Cs P 61 

X Fokl >< Alul >< Aflll >< Eco57I X Afal 
TATACACTTG AGGAAGCTAA GACTGCTCTT AAGAAATGCA AATCTGCATT TTATGTACTA CCTTCAGAAG 

4210 4220 4230 4240 4250 4260 4Z70 

X ScrFI 
x Mval 
X EcoRII 

Xmn l X Ecll36I Nlalll >< 



X 



> < Ksp632I X RmaI >< DsaV Ksp632I >< 

> < Earl > < TfilX Mboll X BstOI >< Earl 

> < Eamll04I >< Mael X BstNI Eamll04I X 
Ddel > < Hinfl >< BsiLI BsmAI >< 



> < 



x BsoWI X Asp700I >< Apyl Alw26I X 

CACCTAATGC TAAGGAAGAG At¥cTAGGAA CTGTATCCTG GAATTTGAGA GAAATGCTTG CTCATGCTGA 
4280 4290 4300 4310 4320 4330 4.340 

X Vspl >< 2sp2I 

X Tru9I >< PpulOI 
>< Msel >< NsiI 

x Mboll >< Nlalll >< Fokl 

x Eco57I >< Mphll03I >< Fokl 

FIGURE 13. 11 
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>< Asnl >< EcoT22I >< BspWI 

>< Asel >< Avalll >< Bgll >< Maell 

AGAGACAAGA AAATTAATGC CTATATGCAT GGATGTTAGA GCCATAATGG CAACCATCCA ACGTAAGTAT 
4350 4360 4370 4380 4390 4400 4410 

>< SfaNI 

>< Tru9I > < Hindll >< Tfil >< Spel 

>< Msel > < HincIIX MboII >< Rmal 

>< Mn H >< DrdI >< Hinfl x Mael 

AAAGGAATTA AAATTCAAGA GGGCATCGTT GACTATGGTG TCCGATTCTT CTTTTATACT AGTAAAGAGC 
4420 4430 4440 4450 4460 4470 4480 



X Maelll 

><: SfcI >< Fnu4HI x Muni 

>< Alul >< Alul >< Acil Maelll X 

CTGTAGCTTC TATTATTACG AAGCTGAACT CTCTAAATGA GCCGCTTGTC ACAATGCCAA TTGGTTATGT 



4490 



4500 



4510 



4520 



4530 



4540 



4550 



X Tru9I 
X Nlalll 

>< Msel 

>< Mnll 
x Ksp632I 
>< Earl 
X Eamll04I 
>< Bbvl 



X Thai 
X Mvnl 

X MboII 
X HinPlI 
>< HinPlI 

X Hin6I 
X Hin6I 

>< Hhal 
X Hhal 
>< Fnu4HI 

X Cfol 
X Cfol 
X BstUI 
X BssHIlX BspWI 
X Bsp50I 
X AccII 



>< Tru9I 
x Msel 

X 



GACACATGGT TTTAATCTTG AAGAGGCTGC GCGCTGTATG CGTTCTCTTA AAGCTCCTGC CGTAGTGTCA 
4560 4570 4580 4590 4600 4610 ^ 4620 

>< Maelll 

^^^ SfaNI ><: AlwNI >< Mnl1 >< MnllX Ddel 

GTATCATCAC CAGATGCTGT TACTACATAT AATGGATACC TCACTTCGTC ATCAAAGACA TCTGAGGAGC 
4630 4640 4650 4660 4670 4680 4690 

X SinI 
X Sau96I 
>< NspIV 

X NspHII 
X Eco47l 
>< Cfrl3I 
>< BsiZI 
X Bmel8l 
X Avail 
>< Asul 



>< Sdul 
>< NspII 
>< HgiAI 
>< Bspl286I 
X Bmyl 
x Alw21I 



>< Rsal 
>< Csp6I 
X Afal 



ACTTTGTAGA AACAGTTTCT TTGGCTGGCT CTTACAGAGA TTGGTCCTAT TCAGGACAGC GTACAGAGTT 
4700 4710 4720 4730 4740 4750 4760 



>< Tru9I 
>< Msel 
X Esp4I 



>< Rsal 
>< HphI 
>< Csp6I 

FTGTTRF n 1 ? 



>< Van91I 
>< PflMI 
x BslI 
>< BsiYI 



> < TthHB8I 

> < TaqI 
>< Sdul 

X NspII 

>< Eco24I 

X Bspl286I 

>< Bmyl Gsul X 
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>< Aflll >< Maelll >< Afal >< AccB7I >< BanllBpml >< 

AGGTGTTGAA TTTCTTAAGC GTGGTGACAA AATTGTGTAC CACACTCTGG AGAGCCCCGT CGAGTTTCAT 
4770 4780 4790 4800 4810 4820 4830 

>< Tru9I 
>< Plel >< EcoNI 
>< Mnll >< BslI 
>< BsmAI X BsiYI 
>< Mnll X HphI >< HinfIX Alw26I>< Acil >< Msel 

CTTGACGGTG AGGTTCTTTC ACTTGACAAA CTAAAGAGTC TCTTATCCCT GCGGGAGGTT AAGACTATAA 
4840 4850 4860 4870 4880 4890 4900 

>< Alul X Ndel 

AAGTGTTCAC AACTGTGGAC AACACTAATC TCCACACACA GCTTGTGGAT ATGTCTATGA CATATGGACA 
4910 4920 4930 4940 4950 4960 4970 

>< SinI 
>< Sau96I 
>< NspIV 

>< NspHII 
>< Eco47I 

>< Cfrl3I ^ a "J ><: 

>< BsiZI >< NlaI " 1T 

X Bme181 M ^ 

x Avail >< Maelll >< Tru9I >< Mnll 

>< AsuI X Fokl >< Msel >< BspHI 

GCAGTTTGGT CCAACATACT TGGATGGTGC TGATGTTACA AAAATTAAAC CTCATGTAAA TCATGAGGGT 
4980 4990 5000 5010 5020 5030 5040 

> < TthHB8I 

X Rsal > < Ta ^ 

> < Rmal X SnaBI >< Seal 

> < Mael >< Maell x Hindlll >< Rsal 

X Csp6I X Ecol05I >< Csp6I ? 

>< Afal x BsaAI x Alul X Afal 

AAGACTTTCT TTGTACTACC TAGTGATGAC ACACTACGTA GTGAAGCTTT CGAGT AC T AC CATACTCTTG 
5050 5060 5070 5080 5090 5100 5110 

x Rsal 

X Nspl 
X NspHI 
x Nlalll 

> < Csp6I X Tru9I Mnll > 

X Afllll >< Msel BslI X 

X Afal >< Dral BsiYI X 

ATGAGAGTTT TCTTGGTAGG TACATGTCTG CTTTAAACCA CACAAAGAAA TGGAAATTTC CTCAAGTTGG 
5120 5130 5140 5150 5160 5170 5180 

X Tru9I >< Tru9I >< RinaI ^ 

x Msel x Msel >< Muni >< Mael Alul > 

TGGTTTAACT TCAATTAAAT GGGCTGATAA CAATTGTTAT TTGTCTAGTG TTTTATTAGC ACTTCAACAG 
5190 5200 5210 5220 5230 5240 5250 

>< SfaNI 
X Sdul 
X NspII 
X Eco24I 
X Bspl286I 
X Bmyl HphI > 

X Bbvl Fnu4HI >< 
>< Mnll >< Banll >< BspWI 
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CTTGAAGTCA AATTCAATGC ACCAGCACTT CAAGAGGCTT ATTATAGAGC CCGTGCTGGT GATGCTGCTA 
5260 5270 5280 5290 5300 5310 5320 

>< Vnel 
>< Snol 

>< Sdul 

>< NspII 

>< HgiAI 

>< Bspl28 6l 

>< Bmyl 
>< ApaLI 

>< Alw44I _ 

><C A1 » 211 X Alul T<°1 \r K 

ACTTTTGTGC ACTCATACTC GCTTACAGTA ATAAAACTGT TGGCGAGCTT GGTGATGTCA GAGAAACTAT 
5330 5340 5350 5360 5370 5380 5 390 

> < SphI 

> < Pael 

> < Nspl 

> < NspHI x Tfil >< Tru9I 
>< Sfcl > < Nlalllx Hinfl >< Ms el 

GACCCATCTT CTACAGCATG CTAATTTGGA ATCTGCAAAG CGAGTTCTTA ATGTGGTGTG TAAACATTGT 
5400 5410 542 ° 5430 5440 5450 5460 

>< Rsal 

>< Tru91 > < Cs P 6I Es P 4I > 

X Msel >< Alul >< AfaT nflTT ^ 

GGTCAGAAAA CTACTACCTT AACGGGTGTA GAAGCTGTGA TGTATATGGG TACTCTATCT TATGATAAT^ 
5470 5480 5490 5500 5510 5520 5530 

>< Rsal 

>< MboII 
>< RmalHinfl >< 

MSSl >< Nlalll >< Af . T ° S1 

TTAAGACA.GG TGTTTCCATT CCATGTGTGT GTGGTCGTGA TGCTACACAA TATCTAGTAC AACAAGAGTC 
5540 5550 5560 5570 5580 5590 5600 

-><• DiaT >K Rsal 

x \llr > < ° deI >< C «P6I 

><: Bs 9 I >< BspWI X BspMI >< Afal 

TTCTTTTGTT ATGATGTCTG CACCACCTGC TGAGTATAAA TTACAGCAAG GTACATTCTT ATGTGCGAAT 
5610 5620 5630 5640 5650 5660 5670 

>< Rsal >K Eco311 

> Rsal >< Ddel 

>< r« < MaeIIJ >< Bs «^ 

X Csp6I _ „ _ 

X A?al X Bsrl >< Mnl1 >< 

GAGTACACTG GTAACTATCA GTGTGGTCAT TACACTCATA TAACTGCTAA GGAGACCCTC TATcSSJtS 

5680 5690 5700 5710 5720 5730 5 740 

>< SstI >< slnI 

>< Sdul >< sau96I 

>< Sa cl >< NspIV 

X NspII >< NspH1I 
x HgiAI > < RsaI >< MaeI1I 

x Eco24I >< Eco47I 

x EC1136II >< C frl3I 

>< Bspl286I >< BsizI 

>K B"^ 1 X BmelSI 



x:Tnj men i .1 
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X Banll >< Avail 

>< Alw21I >< Csp6I>< Asul 

>< Alul > < Afal >< BsrlX AlwNI 

ACGGAGCTCA CCTTACAAAG ATGTCAGAGT ACAAAGGACC AGTGACTGAT GTTTTCTACA AGGAAACATC 
5750 5760 5770 5780 5790 5800 5810 

>< TthHB8I 

>< TaqI >< Maelll 

TTACACTACA ACCATCAAGC CTGTGTCGTA TAAACT CGAT GGAGTTACTT ACACAGAGAT TGAACCAAAA 
5820 5830 5840 5850 5860 5870 5880 

>< Rsal 
>< Csp6I 
>< Sfcl >< Bbvl 
>< Fokl >< Fnu4HI >< Afal 

TTGGATGGGT AT T AT AAAAA GGATAATGCT T AC TAT AC AG AGCAGCCTAT AGACCTTGTA CCAACTCAAC 
5890 5900 5910 5920 5930 5940 5950 

Tru9I >< 
Swal >< 
Msel >< 

> < Nspl MamI >< 

> < NspHI Dral >< 

> < Nlalll BsiBI >< 
>< Afllll BsaBI >< 

CAT T ACCAAA TGCGAGTTTT GATAATTTCA AACTCACATG TTCTAACACA AAATTTGCTG ATGATTTAAA 
5960 5970 5980 5990 6000 6010 6020 

r 

>< MboII 
>< Alul >< Aluix Maelll 

TCAAATGACA GGCTTCACAA AGCCAGCTTC ACGAGAGCTA TCTGTCACAT TCTTCCCAGA CTTGAATGGC 
6030 6040 6050 6060 6070 6080 6090 

>< Sfcl 

GATGTAGTGG CTATTGACTA TAGACACTAT TCAGCGAGTT TCAAGAAAGG TGCTAAATTA CTGCATAAGC 
6100 6110 6120 6130 6140 6150 6160 

>< Tru9I 

>< ScrFI 
>< Mval 
>< Msel 

>< EcoRII 

X Ecll36I 
>< DsaV 

>< BstOI 

>< BstNI Maell X 

>< Muni >< BsiLI >< Dralll 

>< BstXI >< Apyl >< Maell x. BstXI 

CAATTGTTTG GC AC AT T AAC CAGGCTACAA CCAAGACAAC GTTCAAACCA AACACTTGGT GTTTACGTTG 

6170 6180 6190 6200 6210 6220 6230 

> < Rsal 

>< Csp6I MboII X 

> < AfalX BsrI >< Bbsl 
TCTTTGGAGT ACAAAGCCAG TAGATACTTC AAATTCATTT GAAGTTCTGG CAGTAGAAGA CACACAAGGA 

6240 6250 6260 6270 6280 6290 6300 

x Hindll x MboII 

x Hindi >< Mnll x Eco57I 

AT GG ACAATC TTGCTTGTGA AAGTCAACAA CCCACCTCTG AAGAAGT AG T GGAAAATCCT ACCATACAGA 
6310 6320 6330 6340 6350 6360 6370 



FIGURE 13.15 



1er depot 



29/83 

>< Maelll >< Tru9I 

>< Maell >< Ms ei 

AGGAAGTCAT AGAGTGTGAC GTGAAAACTA CCGAAGTTGT AGGCAATGTC ATACTTAAAC CATCAGATGA 
6380 6390 6400 6410 6420 6430 6440 

>< XhoII 
>< Sau3AI 
>< Nlalll 
>< Ndell 
>< Mfll 
>< Mbol 
>< DpnII 

>< Dpnl 
>< BstYI 

>< Tru9I >< BspAI 

>< Mse * >< BspHI X Bspl43lX Fnu4HI 

> < Maelll >< Mnll x Bbvl >< AlwX 

AGGTGTTAAA GTAACACAAG AGTTAGGTCA TGAGGATCTT ATGGCTGCTT ATGTGGAAAA CACAAGCATT 
6450 6460 6470 - 6480 6490 6500 6510 

X Saul 
x Rmal 

>< Mstll 
>< Mael 

>< Eco81I 

>< Ddel 

>< Cvnl 

X Bsu36I 

X Bse21I 

x Bfrl> < Tru9I 

X Tru9I >< Axyl> < Mseix Muni >< Nlalll 

><c MseI >< Alul >< Aocl X Dral >< Bbvl Fnu4HI >< 

ACCATTAAGA AACCTAATGA GCTTTCACTA GCCTTAGGTT TAAAAACAAT TGCCACTCAT GGTATTGCTG 
6520 6530 6540 6550 6560 6570 6580 

X Vspl x Styl 

X Tru9I >< EcoT14I > < DdeI 

X MseI x Ecol30I >< BslI 

X Asnl >< BssTlI >< BsiYI 

AseI >K BsaJI > < Bfrl >< Fnu4HI 

CAATTAATAG TGTTCCTTGG AGTAAAATTT TGGCTTATGT CAAACCATTC TTAGGACAAG CAGCAATTAC 
6590 6600 6610 6620 6630 6640 6650 

X HinPlI 

>< Hin6I >< Tru9I 

>< Hhal >< Maelix MseI 

>< Ddel >< Drain 

X Bbvl >< cfol >< Afllll 
AACATCAAAT TGCGCTAAGA GATTAGCACA ACGTGTGTTT AACAATTATA TGCCTTATGT GXTTACATTA 

6660 6670 6680 6690 6700 6710 6720 

x Rsal > < Rsalx Xbal 

X Csp6I >< Csp6I X Rmal 

X Muni X Afal > < Afal x Mael x Alul 

TTGTTCCAAT TGTGTACTTT TACTAAAAGT ACCAATTCTA GAATTAGAGC TTCACTACCT ACAACTATTG 
6730 674 0 6750 6760 6770 6780 6790 

X Vspl 
>< Tru9l 
>< Nael 
>< Mspl 

X MseI 
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>< Hpall 
>< HapII 
>< CfrlOI >< Fokl 
_ QT X Asnl 

It It X SfaNI >< AselX Hphix Maelll 

CTAAAAATAG ™|x GTTGCTAAAT TATGTTTGGA TGCCGGCATT AATTfiTGTGR AGTCACCCAA 

X Tru9I >< Ddel Maelll > 

>< Msel >< Bfrl >< Bbvl 

ATTTTCTAAA TTGTTCACAA TCGCTATGTG GCTATTGTTG TTAAGTATTT GCTTAGGTTC TCTAATCTGT 

X Sdul 

>< NspII . 

>< HgiAI 

> < Rsal >< Bspl286I 

>< cs P 6i >< ^y 1 

^ _ yt tj t -> <r 7\-F*T >< Alw21I 

gtaactgJt/^ggxgx act™ aat™ ctccttctta TTGTAATGGC gttagagaat 

Tru9I X 
Msel X 

ttt >< Fnu4HI 

X Tru9I > < Maelll BbvJ > 

xgtatctt^Scgxgtaac SSgtacta tggatttctg tgaaggttc, tttccttgca gca TI xgtt, 

Rsal x 
>< HphI 
Csp6I X 

Aiui >: 

Afal X 



> < 



> < 



Tfil 

X Marnl 
Hinfl 
>< BsiBI 

aagtSat^gactcccttg attcttat^agctctSaa agcattcagg-tgaggatttc atcgtacaa^ 

7080 7090 7100 7110 7120 7130 



>< Xranix Maelll 
X Asp700I 



>< Pall 

X NspBII 
>< Haelll 
>< Gdill 

X Fnu4HI 
X Eael 

>< Ddel 
>< BsuRI 

>< Rmal >< Bsh ? >< 

c^gStga caattttagg tctggSgct SgtgSttt tggcatatat gttgttcaca aaattctttt 

X BspMI >< 
X Alul X MaeI 

atttattagg tctttcagct ataatgcagg tgttctttgg ctattttgct agtcatttca tcagcaattc 

7220 7230 7240 7250 7260 i^iv 



> < Nlalll 



>< NlalV 
X Eco64I 

> < Rsal >< BscBI 
>< Csp6I >< BanI 

> < AfalX AccBlI 

FIGURE 13.17 



Rsal >< 

>< MboII 
MamI >< 
Csp6I X 
BsiBI >< 
BsaBI >< 
Afal X 
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TTGGCTCATG TGGTTTATCA TTAGTATTGT ACAAATGGCA CCCGTTTCTG CAATGGTTAG GATGTACATC 
7290 7300 7310 7320 7330 7340 7350 

TthHB8l >< 

>< TaqI 
Mnll >< 

>K NdeI Ksp632I >< 

>< Ksp632I . >< FofcI 

>< Earl >< MboII Earl >< 

>< Fokl >< Eamll04I>< Alulx MboII >< Nlalll EamllCMT >^ 

TTCTTTGCTT CTTTCTACTA CATATGGAAG AGCTATGTTC ATATCATGGA TGGTTGCACC TCTTCGACTT 
7360 7370 7380 7390 7400 7410 7420 

XhoII >< 
Sau3AI >< 
Nlalll >< 

Ndell >< 
Mfll >< 
Mbol >< 

>< Thai > < Ksp632I 

>< Mvnl > < Earl 

i< H^IV >K M1UI > < Eamll04I 

J hk r >< BStUI Ppnil X 

><: HhaI >< BS P 50I >< Rsal R.51-YT w 

><Ts P m 01 ^ ><Cs * 61 >< Spli 1 x 

GCATGATGTG CTATAAGCG^AATCGTGCCA CACG^G^GTgJaCA^S ATTG^S'gC^GAAGAG 
7430 7440 7 450 7460 7470 7480 7 490 

X Pall 
>< Haelll 

>Th2S Mae^I^f 
X Spl I 43I >< Mnll ^tsltl x P1 el>< Hin« aXX £ 

ATCTTTCTAT GTCTATGCAA ATGGAGGCCG TGGCTTCTGC AAGACT CACA ATTGGAATTG TCTCAATTGT 
7500 7510 75 20 7530 7540 7550 7560 

^ ^ RS ^ Tru91 >< 

? SP Mse * >< 

>< Afal >< GSUl >< MaeIIIDraI >< 

GACACATTTT GCACTGGTAG TACATTCATT AGTGATGAAG TT^TcS^ TTTGTCACTC CaS^AAAA 

7570 7580 759 ° 7600 7610 7620 7630 

>< Thai 
>< Mvnl 
> < HphI 
HinPlI >< 

>< HinPlI 

X Hin6I 
X Hin6l 
HhaI x 

x HhaI 
Cfol x 
x Cfol 
>< BstUI 
X BssHII 

> < Bsri BSP501 ><: 

GACCAATCAA CCCTACTGAC CAGTCATCGT ATATTGTTGA TAGTGTTGCT GTGAAAAATG GoSgSSS 
/b4U 7650 7660 7 ^70 7680 7690 7700 
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>< Fokl 

>< BsmAI 

CCTCTACTTT GAGAAGGGTG GTCAAAAGAC C~1gA CATCGGCTCT GGCATTTTGT GAATTTAGAG 

>< Vspl 
>< Tru9I 
>< Msel 
>< Asnl 

X Asel ><: Bcgl/a 

AATTTGAGAG CTAACAACAC TAAAGGTTCA CTGCCTATTA ATGTCATAGT TTTTGATGGC AAGTCCAAAT 

X Sfcl >< PvuII 
>< Rsal >< PspSI 

>< pleI >< Csp6I >< NspBII 

u^fT nrl#sT >< Bcal >< Afal >< Alul 

GCGACGAGTC TGCTTCTAAG TCTGCTTCTG TGTACTACAG TCAGCTGATG TGCCAACCTA TTCTGTTGCT 

TthHB8I >< 
TaqI >< 
Sail >< 
Rtrl >< 

>< Seal Hindll > 

>< Rsal >< Tru9I Hindi > 

>< Csp6I >< SfaNI >< Eco57I 

w zvTmT X Maell >< Afal >< Msel AccI X 

TGAGGAAGCT^GTATCAG ACGTTGGAGA TAGTACTGAA GTTTCCGTTA AGATGTTTGA TGCTTATGTC 
7920 7930 7940 /you /^ou 

>< Tru9I 
>< Msel 

> < Esp4I >< Sfcl 

> < AflU >< BspWI X Alul 
GACACC™ CAGCAACTTT TAGTGTTCCT ATGGAAAAAC TTAAGGCACT TGTTGCTACA GCTCACAGCG 

X PvuII 
X PspSI 
>< NspBII 
>< Fnu4HI 

>< Alul >< Bbvl >< Alul 

AGTTAGCAAA GGGTGTAGCT TTAGATGGTG TCCTTTCTAC ATTCGTGTCA GCTGGGGGAC AAGGTGTTGT 



>< Hindi I 



Maelll >< 
>< BsmAI >< Ddel 



x Hindi >< FoklX Alw26I >< Bfrl 

TGATACCGAT GTTGACACAA AGGATGTTAT TGAATGTCTC AAACTTTCAC ATCACTCTGA CT TAGAAGTG 
8130 8140 8150 8160 8170 8180 biyu 

X XhoII 
Sau3AI X 

X Ndell 
X Mfll 
X Mbol 
x Nlalll >< Hgal 
>< Hinll X DpnII 
Dpnl >< 
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Bspl4 3I >< 
>< BsaHI >< BstYI 

m ttt >K MaeI " >< H P hI >< Bbill X BspAI 

>< Maelll >< HphI >< Nlalll >< AcvI >< 

ACAGGTGACA GTTGTAACAA TTTCATGCTC ACCTATAATA AGGTTGAAAA CATGACGCCC AGAGATCTTG 

8200 8210 8220 8230 8240 8250 8260 

>< Nspl 

>< NspHI 

>< Nlalll 
>< HinPlI 
>< Hin6I 
>< Hhal 

GCGCATGTAT TGACTGTAAT GCAAGGCATA TCAATGCCCA AGTAGCAAAA AGTCACAATG TTTCACTCAT 
8270 8280 8290 8300 8310 8320 8330 

X Nspl 

>< NspHI >< PvuII 

>< Nlalll x PspSI 

>< EamllOSI >< NspBII 
X Bbvl >< Fnu4HI 

><C Afl111 >< Alul X Bbvl > < Fnu4HT 

CTGGAATGTA AAAGACTACA TGTCTTTATC TGAACAGCTG CGTAAACAAA TTCGTAGTGC TGCCAAGAAG 

8340 8350 8360 8370 8380 8390 8400 

>< Rmal 

x MboII >< MaeI >< Eamll05I 

AACAACATAC CTTTTAGACT AACTTGTGCT ACAAC T AGAC AGGTTGTCAA TGTCATAACT ACTAAAATCT 
8410 8420 8430 8440 8450 8460 8470 

>< Tru9I 

X Pall 
X Msel 

x Haelll 
>< Seal >< Esp4I 

X Rsal X Tru9I >< BsuRI 

x Csp6I >< Msel >< BshI 

>< Afal X Dral X Aflll >< rKvt 

CACTCAAGGG TGGTAAGATT GTTAGTACTT GTTTTAAACT TATGCTTAAG GCCACAT TAT TGTGCGTTCT 
8480 8490 8500 8510 8520 8530 8540 

>< Rsal 
>< Csp6l 

>< mn.HT >< BsrI >< Nlalll 

>< Fnu4HI >< AfaI MaeiTT 

TGCTGCATTG GTTTGTTATA TCGTTATGCC AGTACATACA TTGTCAATCC ATGATGGTTA CACAAATGAA 
8550 8560 8570 8580 8590 8600 8610 

>< Maelll 
> < Maelll 

>< Maelll >< FokI 

ATCATTGGTT ACAAAGCCAT TCAGGATGGT GTCACTCGTG ACATCAT TTC TACTGATGAT TGTTTTGCAA 
8620 8630 8640 8650 8660 8670 8680 

>< Nspl Sfcl > 

>< NspHI >< NlaIII =™« >< 

>< Nlalll >< Hgal X BstXI >< B bvT w ai t 

ATAAACATGC TGGTTTTGAC GCATGGTTTA GCCAGCGTGG TGGTTCATAC AAAAATGACA AAAGCTGCCC 



vim tdd 17 on 
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>< ScrFI 
>< ScrFI >< Rsal 

>< Mval >< Mspl 
>< EcoRII >< Hpall 
>< Ecll36I>< Neil 
>< DsaV >< HapII 
X BstOI>< DsaV 
X BstNI >< Csp6I 

>< Fnu4HI >< BsiLI >< BcnIDdel >< 

x aiui ><c A w J ><: AfaI 

TGTAGTAGCT GCTATCATTA CAAGAGAGAT TGGTTTCATA GTGCCTGGCT TACCGGGTAC TGTGCTGAGA 
8760 8770 8780 8790 8800 8810 8820 

> < Maelll >< HphI >< Mnll >< BspWI 

GCAATCAATG GTGACTTCTT GCATTTTCTA CCTCGTGTTT TTAGTGCTGT TGGCAACATT TGCTACACAC 
8830 8840 8850 8860 8870 8880 8890 

Tru9I > 
SfaNI x 
X Rsal 
Msel > 

X BspWI >< Fnu4HI X Csp6I 

X Bbvix Mnll >< Ddel >< AfaI 

CTTCCAAACT CATTGAGTAT AGTGATTTTG CTACCTCTGC TTGCGTTCTT GCTGCTGAGT GTACAATTTT 
8900 8910 8920 8930 8940 8950 8960 

> < Rmal 
X Mnll 

X Fokl > < MaeI 

TAAGGATGCT ATGGGCAAAC CTGTGCCATA TTGTTATGAC ACTAATTTGC TAGAGGGTTC TATTTCTTAT 
8970 8980 8990 9000 9010 9020 9030 

ScrFI > 
Mval > 
Mnll X 
EcoRII >< 
Ecll36I > 
DsaV >< 
BstOI > 

X NlalV BstNI > 

x Fokl BsiLI > 

X Alul >< BscBI ApyI > 

AGTGAGCTTC GTCCAGACAC TCGTTATGTG CTTATGGATG GTTCCATCAT ACAGTTTCCT AACACTTACC 
9040 9050 9060 9070 9080 9090 9100 

X Rsal 
X Sfcl >< Nspl 

X Seal >< NspHI 

>< SfaNI >< Rsal >< Nlalll 

> < Maelll x Csp6I >< Nlalll 

>< Gsul x AfaI >< Csp6I 

X Bpml >< Ddel >< AccI >< AfaI 

TGGAGGGTTC TGTTAGAGTA GTAACAACTT TTGATGCTGA GTACTGTAGA CATGGTACAT GCGAAAGGTC 
9110 9120 9130 9140 9150 9160 9170 

X SstI 
X Sdul 
x SacI 
NspII >< 
HgiAI >< 
Eco24I >< 
Bspl286I X 
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Ecll36II ><>< Bmyl 
Banll >< 

>< Tru9I Alw21I >< 

>< BsrI >< Msel >< Alul 

AGA&GTAGGT ATTTGCCTAT CTACCAGTGG TAGATGGGTT CTTAATAATG AGCATTACAG AGCTCTATCA 
9180 9190 9200 9210 9220 9230 9240 

>< Tfil 

>< SfaNI >< Hinfl >< Alul >< MniI 

GGAGTTTTCT GTGGTGTTGA TGCGATGAAT CTCATAGCTA ACATCTTTAC TCCTCTTGTG CAACCTGTGG 
9250 9260 9270 9280 9290 9300 9310 

>< Maelll 

^ - Eco57 I > < Bbvl Fnu4HI >< 

GTGCTTTAGA TGTGTCTGCT TCAGTAGTGG CTGGTGGTAT TATTGCCATA TTGGTGACTT GTGCTGCCTA 
9320 9330 9340 9350 9360 9370 9380 

>< Rsal 
>< Csp6I >< Nlalll 
X Maell >< Bbvl >< Fnu4HI 

>< Afllll >< AfalX HphI >< BspWI 

CTACTTTATG AAATTCAGAC GTGTTTTTGG TGAGTACAAC CATGTTGTTG CTGCTAATGC ACTTTTGTTT 
9390 9400 9410 9420 9430 9440 9450 

>< Rsal 
>< NlalV 
>< Kpnl 

>< Eco64I > < ScrFI 

>< Csp6I > < Neil . 

>< BscBI >< Mspl 

X Asp718 >< Hpall 

x BanI >< Alul >< Hinfl 

X Afal >< HapII >< Plel 

>< AccBlI > < Bcnl > < Ddel 
x Acc65I >< AlulX DsaV X AccI 
TTGATGTCTT TCACTATACT CTGTCTGGTA CCAGCTTACA GCTTTCTGCC GGGAGTCTAC TCAGTCTTTT 

9460 9470 9480 9490 9500 9510 9520 

>< Rsal 
X Csp6I 

>< Afal X HphI >< HphI Nlalll X 

ACTTGTACTT GACATTCTAT TTCACCAATG ATGTTTCATT CTTGGCTCAC CTTCAATGGT TTGCCATGTT 
9530 9540 9 550 9560 9570 9580 9590 

TTCTCCTATT GTGCCTTTTT GGATAACAGC AATCTATGTA TTCTGTATTT CTCTGAAGCA CTGCCATTGG 
9600 961 ° 9 620 9630 9640 9650 9660 

X TthHB8I 
X Rsal 
>< Mnll 
X Mnll 

>< Tru9I >< Csp6I 

l K I™* 1 ^ >< PleI >< Bcgl/a X TaqI 

>< Msel x Ddel >< Nlalll >< BbvI 

X Eco57I X Bfrl x Hinfl x Msel X Maelll >< Afal Fnu4HI >< 

TTCTTTAACA ACTATCTTAG GAAAAG AG T C ATGTTTAATG GAGTTACATT TAGTACCTTC GAGGAGGCTG 

9670 9680 9690 9700 9710 9720 9730 

X Rsal 

X Csp6I >< RsaI 

>< Bc <3 x >< Csp6I x BsmAI 
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>< A f a i x Afal >< Alw26I 

CTTTGTGTAC CTTTTTGCTC AACAAGGAAA TGTACCTAAA ATTGCGTAGC GAGACACTGT TGCCACTTAC 
9740 9750 9760 9770 9780 9790 9800 

>< NlalV 
>< Rsal >< Ddel 

X Csp6I >< BscBI 

>< Afal >< Bfrl Alul >< 

ACAGTATAAC AGGTATCTTG CTCTATATAA CAAGTACAAG TATTTCAGTG GAGCCTTAGA TACTACCAGC 
9810 9820 9830 9840 9850 9860 9870 



>< Fnu4HI 

>< Ddel 

>< Fnu4HI >< Bfrl 

>< Bbvl >< Alul >< Bbvl X Ddel >< AlwNI 

TATCGTGAAG CAGCTTGCTG CCACTTAGCA AAGGCT CTAA ATGACTTTAG CAACTCAGGT GCTGATGTTC 
9880 9890 9900 9910 9920 9930 9940 

X Sfcl >< BsmI 

X PstI >< BscCI 

TCTACCAACC ACCACAGACA TCAATCACTT CTGCTGTTCT GCAGAGTGGT TTTAGGAAAA TGGCATTCCC 
9950' 9960 9970 9980 9990 10000 10010 

X Rsal 
x Nlalll 

x Maelll 

X Csp6I >< Tru9I 

x Afal >< M sel 

GTCAGGCAAA GTTGAAGGGT GCATGGTACA AGTAACCTGT GGAACTACAA CTCTTAATGG ATTGTGGTTG 

,-^«^,rv 1 10080 



10020 



10030 



10040 



10050 



1CT060 



10070 



X Fokl 
X Bstll07I 
X AccI 



X 



x Nspl 
X NspHI 
X NlalU 
Afllll 



X Tru9I 
X Nspl 
X NspHI 
X Nlalll 
>< Msel 
X MboII 
> < Bbsl 



XhoII 
Sau3AI 
Ndell 
Mfll 
Mbol 
DpnII 
BstYI 
BspAI 
Bglll 



X 
X 

>< 
X 
X 
X 
X 
X 
X 



GATGACACAG TATACTGTCC AAGACATGTC ATTTGCACAG CAGAAGACAT GCTTAATCCT AACTAT GAAG 
10090 10100 10110 10120 10130 10140 10150 

Pall > 
MscI > 
Haelll > 
Eael >< 
BsuRI > 

X Dpnl X MboII ^shl > 

X Bspl4 3I X Alul Bal1 > 

ATCTGCTCAT TCGCAAATCC AACCATAGCT TTCTTGTTCA GGCTGGCAAT GTTCAACTTC GTGTTATTGG 
10160 10170 10180 10190 10200 10210 10220 

X Ddel> < Tru9I 

>< Bfrl> < Msel >< Ddel 

CCATTCTATG CAAAATTGTC TGCTTAGGCT TAAAGTTGAT ACTTCTAACC CTAAGACACC CAAGTATAAA 
10230 10240 10250 10260 10270 10280 10290 



X ScrFI 
X Mval 
X EcoRII 
x Ecll36I 



X SphI 
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X DsaV 
>< BstOI 
>< BstNI 
>< BsiLI 
X Apyl 



>< Pael 
>< Nspl 
>< NspHI 
>< Rmal >< Nlalll 
>< Mael >< HphI 



TTTGTCCGTA TCCAACCTGG TCAAACATTT TCAGTTCTAG CATGCTACAA TGGTTCACCA TCTGGTGTTT 
10300 10310 10320 10330 10340 10350 10360 

>< Sau3AI 

X Ndell 

w — _ >< Mboix Nlalll 

>< Eco311 >< Dpnil 

><C BsraAI >< Tru9I>< Dpnl 

X BsalX Nlalll >< Tru9I >< MseI Bspl43l 

>< Alw26I >< MseI >< BspAIX Alwl 

ATCAGTGTGC CATGAGACCT AATCATACCA TTAAAGGTTC TTTCCTTAAT GGATCATGTG GTAGTGTTGG 
10370 10380 10390 10400 10410 10420 10430 

>< 2sp2I 
>< PpulOI 

>< NsilX SfaNI 

>< Ndel 
X Mphll03I 
>< EcoT22I 
< Aval II >< Alul 



Rsal >< 
Csp6I x 
Afal x 



>< Tru9I 

>< MseI > 

TTTTAACATT GATTATGATT GCGTGTCTTT CTGCTATATG CATCATATGG AGC T T CC AAC AGgAgScAC 
10440 10450 10460 10470 10480 10490 10500 

>< SinI 
X Sau96I 
>< NspIV 

X NspHI I 
X Eco47I 
>< Cfrl3I 
X BsiZI 
>< Bmel8I 
X Avail 



>< Hindu 
>< Hindi 



>< Sfcl 
Rsal X 
PstI >< 
X Fnu4HI 
Csp6I X 
X BspWI 



X Rsal 
x Csp6I>< Ddel 

X AfalX Bfrl >< Asulx Bsql x Bbvl >< BsdMI a f a t x 

GCTGGTACTG AC TTAGAAGG TAAATTCTAT GGTCCATTTG TTGACAGACA AACTGCACAG GCTGcIgGTA 

10510 10520 10530 10540 10550 10560 10570 

X Tru9I x Nlalll 

X MseI x Bbvl x Fnu4HI Hohl >< 

CAGACACAAC CATAACATTA AATGTTTTGG CATGGCTGTA TGCTGCTGTT ATCAATGGTG ATAGGTGGTT 
10580 10590 10600 10610 10620 10630 10640. 

x Tru9I 

x Tfil 

X MseI _ D T 

^ « u-r >< Rsal 

>< H P hI t >< Tru9I >< Cs p6I 

X Hmfl >< Mse i ><c Af x 

TCTTAATAGA TTCACCACTA CTTTGAATGA CTTTAACCTT GTGGCAATGA AG TAC AACTA TGAACCTTTG 
10650 10660 10670 10680 10690 10700 10710 

X SinI 
>< Sau96I 

>< PssI 

>< PspSII 
X PpuMI 
X NspIV. 

X NspHII 

X NlalV 
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X Sau3AI 
>< Ndell 
>< Mbol 

>< DpnIIX Nlalll 

>< Dpnl >< Hindll 
>< BspAI >< Hindi 
>< Bspl43I 



>< EcoO109I 
>< Eco47I 
>< Drall 
X Cfrl3I 
>< BsiZI 

>< BscBI 
>< Bmel8I 
>< Avail 
>< Asul 



X Bspl43I ^mmrrr nrcT^ CTTTCTGCTC^AAACAGGAAT TGCCGTCTTA GATATGTGTG 

ACACAAGATC ATGTTGACAT ATTGGGACCT CTTTCTGCTC Aaa 



X Ddel 
>< Bfrl 
>< Bbvl 



10720 



10730 



10740 



>< 



>< Fnu4HI 

>< Bbvl 
>< Bbvl 



>< Sfcl 
>< Fnu4HI 
>< Fnu4HI 
>< Alul >< PstI 



> < 



>< 
Rsal 
X 
>< 
Csp6I 
>< 
>< 
>< Afal 



Styl 

EcoT14I 
Ecol30I 

BssTlI 
BsaJI 



»££S CAGAA^A —CO TACTATCCTT Gg™ TTTTAGARGft 

>< Styl 
X EcoT14I 
X Ecol30I 
X BssTlI 
> < MaelllX BsaJI 
-"Sj™ TTGTTAGACA AXGC^ G.™ -»« 



X SfaNI 

> < Sdul 

> < Nspl I 

X Tru9I> < Bspl286I 
>< Msel > < BroyI 
GTTAAGGGCA CTCATCATTG 
10930 10940 



X Maelll 
AGTGGTCACT GTTTTTCTTT 
11000 11010 



X Fokl >< Hinfl Afal >< 

GATGCTTTTA ACTTTCTTGA CATCACTATT GATTCTTGTT CAAAGTACAC 
10950 10960 10970 10980 10990 

^ v „„t >< Muni 

>< XmnI . ,, T . 

>< Bsml Fnu4HI > 

>< BscCI Bs P WI >< 

>< Asp700I >< Bbvl Bbvl > 

GTTTACGAGA ATGCTTTCTT GCCATTTACT CTTGGTATTA TGGCAATTGC 
11020 H030 11040 11050 H060 



>< Nspl 

>< NspHI >< Tru9I 

>< Nlalll >< ^el n >< r ,! SmI >< waelll 

-s^-sS^ja s ^ss TTGIG ^o 

X SfaNI 
>< Rmal 

> < Nspl 

> < Nlalll 

X Nhel 

>< Tru9I >K MaeI 

ACAGTTGCTT^ACTTTAATAT GG^G TATCATGACA*TGGCTTGAAT 

FIGURE 13.25 



X MamI 

>< HphI 
X BspHI 
X BsiBI >< Nlalll 

X BsaBI >< NlalU 
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>< Tru9I 
>< Msel 

> < Rmal > < Esp4I 

> < MaeI >< Eco57I 

>< AluI > < Aflll >< AluI 

TGGCTGACAC TAGCTTGTCT GGTTATAGGC TTAAGGATTG TGTTATGTAT GCTTCAGCTT TAGTTTTGCT 
11210 11220 11230 11240 11250 11260 11270 

>< Rmal 

>< Maell 
>< MaeI 

> < Nlalll >< SfaNI >< Fnu4HI 

>< BspHI >< AluI >< Bbvl >< Afllll 

TATTCTCATG ACAGCTCGCA CTGTTTATGA TGATGCTGCT AGACGTGTTT GGACACTGAT GAATGTCATT 
11280 11290 H300 11310 11320 11330 11340 

>< Sau96I 
>< Pall 
>< NspIV 
>< Nlalll 

>< Haelll 

> < Ddel 
>< Cfrl3I 

>< BsuRI 
>< BsiZI 
>< BshI 

> < Bfrl 
>< Asul 



>< Sau3AI 
x Ndell 
X Mbol 
>< Dpnll 
>< Dpnl 

>< A I ><: Bsp1431 

ACACTTGTTT ACAAAGTCt/SaTGGTAAT GCTTtJgaJJ^GCTaSc CATGTGGGcS^TAGTTATTT 
11350 11360 11370 11380 11390 11400 11410 



>< Rmal 
>< Nlalll 

>< Maelll >< MnH >< Mae lII >T ^TllT 

CTGTAACCTC taactattct ggtgtcgtta cgactatcat gtttttagct agagctatag tgtttgtgtg 

11420 11430 11440 11450 11460 11470 11480 

Ddel > 

TGTTGAGTAT TACCCATTGT TAT T TAT T AC TGgSaSS TTACAGTGTA TCATGCTTGT ^TTATTGTTTC 
i-L^yu 11500 11510 H520 11530 11540 11550 

x Pall 
X Haelll. 
>< Fnu4HI >< BsuRI 
x Bbvl >< Fnu4HI >< BspWI 

>< Bbvl >< BspWI >< BshI X Eco57I X MaelII 

TTAGGCTATT GTTGCTGCTG CTACTTTGGC CTTTTCTGTT TAC T CAACCG TTAC^CAGG CTTACTCTTG 
11560 11570 11580 11590 H600 H610 11620 



X Eco31I 
>< BsmAI 
X Bsal 



>< ScrFI 
>< Mval 

>< EcoRIl 

X Ecll36I 

>< DsaV 

>< BstOI 
X BstNI 
>< BsiLI 
> < BsaJI 

X BsaJI 
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>< DrdI >< Alw2 6I >< Apyl Ddel >< 

GTGTTTATGA CTACTTGGTC TCTACACAAG AATTTAGGTA TATGAACTCC CAGGGGCTTT TGCCTCCTAA 
11630 11640 11650 11660 11670 11680 11690 

>< Tru9I 
>< Msel 

X SfaNI > < HindIII> < Tru9I 

>< MnlI >< Alul > < Msel > < Mnll > < Nlalll 

GAGTAGTATT GATGCTTTCA AGCTTAACAT TAAGTTGTTG GGTATTGGAG GTAAACCATG TATCAAGGTT 
11700 11710 11720 11730 11740 11750 11760 

>< Vnel 
>< Snol 

>< Sdul 
>< NspII 
>< HgiAI 
>< Bspl286I 
>< Bmyl >< Rsal 
>< Rsal >< ApaLI >< MboII 

X Csp6I >< Alw4 4I >< Csp6I Ddel > 

>< Afal >< Maell X Alw21I >< Afal Bfrl > 

GCTACTGTAC AGTCTAAAAT GTCTGACGTA AAGTGCACAT CTGTGGTACT GCTCTCGGTT CTTCAACAAC 
11770 11780 11790 11800 11810 11820 11830 

X NspII> < Rsal 

X Dralll 
X SduIX Csp6I 
X MboII >< Bspl286I 

X Hinfl >< Plel >< Bmyl > < Afal X MboII 

TTAGAGTAGA GTCATCTTCT AAATTGTGGG CACAATGTGT ACAACTCCAC AATGATATTC TTCTTGCAAA 
11840 11850 11860 11870 11880 11890 1190.0 

X TthHB8I 

X TaqI SfcI ><: 

x Hindlll x MboII >< Nlalll 

X Alul > < Eco57I >< BspWI AccI >< 

AGACACAACT GAAGCTTTCG AGAAGATGGT TTCTCTTTTG TCTGTTTTGC TATCCATGCA GGGTGCTGTA 

11910 11920 11930 11940 11950 11960 11970 

>< vspl 

>< Tru9I > < Ksp632I 

>< Msel X TthHB8I > < Earl 

X Asnl X TaqI >< MboII > < Eamll04I 

X Aseix Mnll X Bcgl/a X Eco57I >< Eco57I x Bcgl 

GACAT TAAT A GGTTGTGCGA GG AAATGCTC GATAACCGTG CTACTCTTCA GGCTATTGCT TCAGAATTTA 
11980 11990 12000 12010 12020 12030 12040 

X StuI 
X ScrFI 

x Pall 
X Mvaix Haelll 
X EcoRIlX Ecol47I 

X Ecll36I 
X DsaV X BsuRI 
X BstOI 
X BstNI 

X BspWI 
>< BsiLI 

X Fnu4HI X BsaJI >< BshI Tfil X 

X Ndel X BspWIX Mnll X" Bgll >< SfcI Hinfl >< 

X Acil >< ApylX AatI > < Alul 



FIGURE 13. 27 



1er depot 



41/83 

GTTCTTTACC A T CA T „GCC GC^GCCA CT.CCCAGCA GGCCXATGAG CAGGCTGTAG C,^ 

>< Asp700I >< Eco57I 

TTCTGAAGTC GTTCTCAAAA AGTTAAAGAA ATCTTTGAAT GTGGCTAAAT CTGAGTTTGA^CCGTGATGCT 
12130 12140 12150 12160 12170 12180 

XhoII >< 
Sau3AI >< 
Ndell >< 

Mnll > 
>< Mnll 

i < ™» >: ss 

> < NdeI1 DpnII >< 

I I ^° X rr Dpnl X 

.^n 11 . Dd ^I >< 

°P nI BstYI >< 

>< BspWI >< RsalBspAI X 

x Nlalll > \< S K! 14 , T >K Cs P 6IBspl43I x 

—gS «~ — - ~A T GACGCAAA, G^Sf ^ G 

> J< S St ><: Ks P 6321 > < HindHI 

w h,„ttt >< Dd el >< SfaNI 

X Maelll >< MboII >K Eamll04r >K BspW1 ZaNI 

— ss —as; ™ -~ 

>< Thai 

>< Mvnl 
>< HinPlI 
>< Hin6I 

>< Hhal 

>< Cfol 

>< BstUI 

>K Tru91 >< BspSOI 

>< Msel >< AccII 

TGATGCACTT AACAACAXJA TCAACAATGC GC_ TGTGTTCCAC ACCA^ACJ 

>< Rsal 
>< NlalV 
>< Eco64I 
>< Csp6I 
>< BslI 

>< BsiYlx Kpnl 
>< BscBI 
>< BanI 
>< Asp718 

>< Nlalll >< AfaI 

>< BstXI >< AccBlT 

>< Fnu4HI x Bbvl >< SeScs? >< MaeIXI 

ACAGCAGCCA AACTCATGGT TGTTGTCCCT GATTATGGTA CCTACAAGAA CACTTGTGAT GGTAACACCT 

>< 2sp2l 
X PpulOI 
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>< Nsil 

X Mphll03I DdeI >< 

>< NdelX ECOT22I cfaNT y< AciI Bfrl >< 

>< Avalll >< SfaNI ~«£S T TG r-^^ 

L2500 
>< Pall 



T «c £™g^aaa,cc »»» ™" — » 



12470 



>< Haelll >< Mnll >< DdelDdel >< 
~, ^ Ml ttt >< BsuRI >< Maelll >< BspWI 

X Tru9I>< Nlalll XcmI >< BshI >< Alul BspWI X 

TGAAATTAA^ATGGACAATT ^ GGc™ ~ CAGCTCTAAG AGCCAACTCA 

Rsal >< 
NlalV >< 
Kpnl >< 
>< Fnu4HI 
Eco64I >< 
Csp6I >< 
BscBI >< 

>< Tru9I Asp718 >< 

x PvuII Afal >< 

X PspSI >< AcilX BanI 

""KLl ><H ff >< P1 eX ><pshM 

^AAAC J«S£»» *™ CCAG^GGAC T AGGAGAG„ GTCCTGTGCG GO™ 

X TthHB8I 

X TaqI ^ 
X Sful j. 
x NspV 
X Mnll 
X Lspl 
>< Csp4 5I 
X BstBI 

_ _ X Bspll9I 

>< Cs P 61 X Bpul4I 

>< AluI _ - _ X AsuII 

CAGAAACAGC TTGTACTGAT GAGAA.GCAC TTGCCTACTA TAACAATTCG AAGGGAGGTA GGTTTGTGCJ 

X XhoII 
X Sau3Al 
X Ndell 
X Mf II 
X Mbol 
X DpnII 

x^sSf >< «il >< Csp6I 

x Jn >< Mael >< Mel >< Afaix M»I 

GGCATTACTA TCAGACCACC AAGATCTCAA ATGGGCTAGA TTCCCTAAGA GTGATGGTAC AGGTACAATT 
12 750 12760 12770 12780 ^ /yu 

>< Sau96I 

X PssI 
X Pall 
X NspIV 



FIGURE 13.29 
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>< Haelll 
>< Eco0109I 
>< Drall 
>< Cfrl3I 

>< BsuRI 

>< NlalV >< Bsizi 

>< BsrI 

>< BscBI > < Maelll >< Asul 



Rsal > 

>< BshI Csp6I >< 

Afal > 



TACACAGAAC TGGAACCACC TTGTAGGTTT GTTACAGACA CACCAAAAGG GCCTAAAGTG AAATACTTGT 
12820 12830 12840 12850 12860 12870 12880 

>< Sfcl 

> < MboII 
Maell >< 
>< Fnu4HI >< Rsal 

m „ >< Eco57I X Csp6I 

>< Tru91 > < Bbsl 

>< Msel >< Mnll >< Bbvl >< Alul >< Afal 

ACTTCATCAA AGGCTTAAAC AACCTAAATA GAGGTATGGT GCTGGGCAGT TTAGCTGCTA CAGTACGTCT 
12890 12900 12910 12920 12930 12940 12950 

>< Rsal 
>< Sfcl >< Csp6I 
>< BspWI X Afal >< BspMI AccI X 

TCAGGCTGGA AATGCTACAG AAGTACCTGC CAATTCAACT GTGCTTTCCT TCTGTGCTTT TGCAGTAGAC 
12960 12970 12980 12990 13000 13010 13020 

X Rmal 

X Mnll 
>< Mael >< HphI 

CCTGCTAAAG CATATAAGGA TTACC TAGCA AGTGGAGGAC AACCAAT CAC CAACTGTGTG AAGATGTTGT 
13030 13040 13050 13060 13070 13080 13090 

X SinI 
>< Sau96I 
X NspIV 

X NspHII 
X Nlalll 
X Eco47l 

X EarallOSI 

X Rsal >< Rsal bS? 1 

>< MboII x Csp6I ZZ ^ v T 

>< Csp6l x BsrI Jt Til XGmI 

•><r n%*r ^ *Z t >K Avail Plel X 

X Afal >< Afal >< Maelll >< Alul >< Asul> < HinfT 

GTACACACAC TGGTACAGGA CAGGCAATTA CTGTAACACC AGAAGCTAAC ATGGACCAAG AGTCCTTTGG 

13100 13110 13120 13130 13140 13150 13160 

X Tfil 

>< Nlalll >< Fokl >< Hinfl 

TGGTGCTTCA TGTTGTCTGT ATTGTAGATG CCACATTGAC CATCCAAATC CTAAAGGATT CTGTGACTTG 
13170 13180 13190 13200 13210 13220 13230 

> < Rsal 
>< MaeXI 

"> < SP J\ >< D ^el 

> < AfaI >< BsrI >< Bfrl 
AAAGGTAACT ACGTCCAAAT ACCTACCACT TGTGCTAATG ACCCAGTGGG TTTTACACTT AGAAACACAG 

13240 13250 13260 13270 13280 13290 13300 



>< Thai 
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>< SfaNI 
>< Mvnl 
>< BstUI 

_ >< BspSOI 

RsaI >< Acil 

>< Acil >< SfcI >< Maelll >< AccIISfaNI >< 

TCTGTACCGT CTGCGGAATG TGGAAAGGTT ATGGCTGTAG TTGTGACCAA CTCCGCGAAC CCTTGATGCA 
13310 13320 13330 13340 13350 13360 13370 



Fnu4HI >< 



>< Zsp2I 

> < SfaNI 
X Mphll03I>< Tru9I 
>< PpulOIX Maell 

X Nsil> < Fokl °f>gl ><z 

X EcoT22I >< Msel ><z Bt>vl 

X Aciix Avalll >< Oral X Acil >< Fnu4HI AcxI X 
GTCTGCGGAT GCATCAACGT TTTTAAACGG GTTTGCGGTG TAAGTGCAGC CCGTCTTACA CCGTGCGGC£ 

13380 13390 13400 13410 13420 13430 13440 

x Spel 

x Seal 
>< RsaI 
>< Rmal 

>K ff Csp 6I >< Sfd >< BSPWI 

x BsdWI x Afal >< AccI >< Bcgl/a Bcgl > 

CAGGCACTAG TACTGATGTC GTCTACAGGG CTTTTGATAT TTACAACGAA AAAGTTGCTG GTTTTGCAAA 
13450 13460 13470 13480 13490 13500 13510 

X ScrFI 
X Mval 

X Mnll 
X EcoRII 
X Ecll36I 
X BstOI 
X BstNI 

X BslI 
X DsaV X BsiYI 

X BsiLI >< Plel 

X Apyl > < Fokl X Hinfl 

GTTCCTAAAA ACTAATTGCT GTCGCTTCCA GGAGAAGGAT GAGGAAGGCA ATTTATTAGA CTCTTACTTT 
13520 13530 13540 13550 13560 13570 13580 

X Nlalll 
X Ksp632I 
>< Earl 

>< Tru9I >< Eamll04I 

X Msel >< BsmAI ^ Tru91 

>< MnlI X Alw26I >< MboII >< Msel 

GTAGTTAAGA GG CAT AC TAT GTCTAACTAC CAACATGAAG AGACTATTTA TAACTTGGTT AAAGATTGTC 

13590 13600 13610 13620 13630 13640 13650 

x RsaI 
x NlalV 

> < Nlalll 

>< Kpnl 
X HphI 

> < Eco64I 
>< Csp6I 

>< BscBI 

> < BanI 

> < Asp718 



FIGURE 13.31 
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>< Maelll >< Afal 
>< NspBII > < AccB li Maell >< 

>< A ci* >< Nlalll > < Acc65I > < Hgal 

CAGCGGTTGC TGTCCATGAC TTTTTCAAGT TTAGAGTAGA TGGTGACATG GTACCACATA TATCACGTCA 
13660 13670 13680 13690 13700 13710 13720 

X Mnll 
>< Maell 

GCGTCTAACT AAATACACAA TGGCTGATTT AGTCTATGCT CTACGTCATT TTGATGAGGG TAATTGTGAT 
13730 13740 13750 13760 13770 13780 13790 

>< Tru9I 

>< Msel >< Maelll >< Muni 

AC AT T AAAAG AAATACTCGT CACATACAAT TGCTGTGATG ATGATTATTT CAATAAGAAG GATTGGTATG 



13800 



13810 



13820 



13830 



13840 



13850 



13860 



>< Thai 
>< Mvnl 
X Mlul 

>< BstUI >< RsaI 

>< BspSOI >< HphI 

>< Tfil >< Afllll >< Ddel >< Csp6I Tru9I >< 

>< Hinfl >< AccII >< Bfrl >< Afal Msel >< 
ACTTCGTAGA GAATCCTGAC ATCTTACGCG TATATGCTAA CTTAGGTGAG CGTGTACGCC AATCATTATT 

13870 13880 13890 13900 13910 13920 13930 



> < SfaNI 
>< RsaI 
>< Csp6I 
>< Afal 



x 



>< SfaNI 



X RsaI 
> < Csp6I 
BspWI 

>< Afal 



XhoII 
Sau3AI 
Ndell 
Mfll 
Mbol 
DpnII 
BstYI 
BspAI 



> 
> 
> 
> 
> 
> 
> 
> 



AAAGACTGTA CAATTCTGCG ATGCTATGCG TGATGCAGGC ATTGTAGGCG TACTGACATT AGATAATCAG 



13940 



13950 



13960 



13970 



13980 



13990 



14000 



X Tru9I 
x Msel 
x Dpnl 
x Bspl43I 

>< Alwl 



X RsaI 
>< Csp6I 
>< BsrI 
>< Afal 



HphI 



x RsaI 

> < 
X Csp6I 

> < Bbvl 
X Afal 



ScrFI 
Mval 
X Fnu4HI 
X EcoRII 

> < Ecll36I 
BstOI 
BstNI 

X BslI 
X BsiYI 
BsiLI 
Apyl 



> 
> 



> 
> 



> 
> 



X DsaV X Acil 



GATCTTAATG GGAACTGGTA CGATTTCGGT GATTTCGTAC AAG TAGCACC AGGCTGCGGA GTTCCTATTG 
14010 14020 14030 14040 14050 14060 14070 



X Tfil 
X Hinfl 



X SfaNI 
X Fokl 



X MamI 
>< BsiBI 
X BsaBI 



X Rmal 
X Mnll 
>< Mael 
>< Bbvl 



X SfaNI 
> < Hinfl 
X Fnu4HIPleI >< 
>< Ddel 
>< BspWI Ndel >< 



TGGATTCATA TTACTCATTG CTGATGCCCA TCCTCACTTT GAC TAGGGCA TTGGCTGCTG AGTCCCATAT 
14080 14090 14100 14110 14120 14130 14140 

>< Sau3AI 
X Ndell 
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X Mbol 
>< Maml 
>< DpnII 
X Dpnl 

>< BspWI 
>< BspAI 

X Bspl43I >< Xcml 

>< BsiBI >< Tru9I 

>< BsaBI >< Fokl >< Msel 

GGATGCTGAT CTCGCAAAAC CACTTATTAA GTGGGATTTG 
14150 14160 14170 14180 



Tthllll >< 
Mbol I >< 
X Ksp632I 
>< Eamll04I 

>< BsmAI 
>< Earl Aspl >< 
>< Alw26I 
CTGAAAT AT G ATTTTACGGA AGAGAGACTT 
14190 14200 14210 



>< 
>< 



TthHB8I 
TaqI 

>< Mcrl 

> < Ksp632I 

> < Earl 

> < Eamll04I 
BsmAI > 

X BsiEI> 
Alw26I 



X 

> 
> 
> 



< SinI 

< Sau96I 

< NspIV 
X NspHII 
x NlalV 
Fokl 

< Eco47I 

< Cfrl3I 

< BsiZI 



X SspIX BscBI 

< Tru9I > < Bmel8I 

< Msel > < Avail 
>< Dral > < Asul 



>< Muni 



>< 

X 



Tru9I 
Msel 



X 

x Mbol I 

tgtctcttcg'accgttattt taaatattgg gaccagacat accatcccaa TTGTATTAAC TGTTTGGATG 
14220 14230 14240 14250 14260 14270 14280 

SinI >< . 
Sau96I >< 

NspIV ><; 

NspHII > 
Eco47I x 
Cfrl3I X 

BsiZI X 
Bmel8I X 

X Tru9I Avail >< 

>< Fokl >< Msel AsuI >< 

ATAGGTGTAT CCTTCATTGT GCAAACTTTA ATGTGTTATT TTCTACTGTG TTTCCACCTA CAAGTTTTGG 
14290 14300 14310 14320 14330 14340 14350 



x Spel 
>< Rmal 

x Mael >< Sspl >< BsrI 

ACCAC TAGTA AGAAAAATAT TTGTAGATGG TGTTCCTTTT GTTGTTTCAA CTGGATACCA TTTTCGTGAG 
14360 14370 14380 14390 14400 14410 14420 

x Thalx Esp3I 

>< Ddel 

X BstUI 

X BspSOI X BsmBI 

X MvnIX BsmAI 
X HgalX Alul >< Alw26I 

X Fokl >< AccII > < Bbvl 



X Rsal 
X Hinfl >< Plel 
> < Csp6I 
x Afal 



TTAGGAGTCG TACATAATCA GGAT GTAAAC TTACATAGCT CGCGTCTCAG TTTCAAGGAA CTTTTAGTGT 
14430 14440 14450 14460 14470 14480 14490 

>< Zsp2I 
X SphI 
>< PpulOI 

>< Pael 
>< Nspl 

FIGURE 13.33 
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>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 

> < Dpnl 

>< Fnu4HlX BspWI 
>< BspAI 

> < Bspl43I> 
><* Alwl >< Alul 



>< NspHI 
>< Nsil 

>< Nlalll 
>< Mphll03l 

>< Fnu4HI 
>< EcoT22I 
X BspWI 

< Avalll > < AlwNI 

>< Alul >< Bbvl 



>< Rmal 
>< Mael 



>< Nspl 
NspHI >< 
Nlalll >< 

>< BspWI 
>< Bsgl 
>< Bbvl 



ATGCTGCTGA TCCAGCTATG CATGCAGCTT CTGGCAATTT ATTGCTAGAT AAACGCACTA CATGCTTTTC 
14500 14510 14520 1453.0 14540 14550 14560 

>< ScrFI 
>< Neil 
>< Mspl 
>< Hpall 

>< Fnu4HI >< HapII 

>< AlwNI >< DsaV >< Tru9I 

>< Alul >< Bcnl >< Msel 

AGTAGCTGCA CTAACAAACA ATGTTGCTTT TCAAACTGTC AAACCCGGTA ATTTTAATAA AGACTTTTAT 
• 14570 14580 14590 14600 14610 14620 14630 

>< Tru9I Ddel x 

>< Msel >< Mbol I Bbvl X 

GACTTTGCTG TGTCTAAAGG TTTCTTTAAG GAAGGAAGTT CTGTTGAACT AAAACACTTC TTCTTTGCTC 
14640 14650 14660 14670 14680 14690 14700 

>< Fokl EcoRV >< 

X Fnu4HI Eco32I X 

AGGATGGCAA CGCTGCTATC AGTGATTATG ACTATTATCG TTATAATCTG CCAACAATGT G TG AT AT CAG 

14710 14720 14730 14740 14750 14760 14770 



>< Vspl 
X Tru9I 
X Msel 
X Asnl 

>< Maelll x Asel 

ACAACTCCTA TTCGTAGTTG AAGTTGTTGA TAAAT ACT T T GATTGTTACG ATGGTGGCTG TATTAATGCC 
14780 14790 14800 14810 14820 14830 14840 



X Tru9I 

>< Msel 
x Hpal 
>< Hindll 
X Hindi 



x Pvull 
x Psp5l 
X NspBII 
X Alul 



X 
X 



> < Xcml 
Tru9I 
Msel 



Rmal >< 
Mael X 



AACCAAGTAA TCGTTAACAA TCTGGATAAA TCAGCTGGTT TCCCATTTAA TAAAT GGGGT AAGGCTAGAC 



14850 



14860 



14870 



14880 



14890 



14900 



14910 



X 



SfaNI 
X Sau3AI 
>< Ndell 
X Mbol 
X DpnII 
>< Dpnl 

Plel >< Bspl43I 

>< HinfIX Mnll X BspAI X Alwl 
TTTATTATGA CTCAATGAGT TATGAGGATC AAGATGCACT 
14920 14930 14940 14950 



X 



X Thai 
X Mvnl 
X BstUI 

X Bstll07I 
X BspWI X Fokl 
X BspSOI 
X Accllx Ddel 
X Accl 

TTTCGCGTAT ACTAAGCGTA ATGTCATCCC 
14960 14970 14980 



X SstI 
>< Sdul 
>< SacI 
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>< NspII 
>< HgiAI 
X Eco24I 

< EC1136II 
>< Bspl286I 
>< Bmyl 
>< Banll 
>< Alw21I 

< Alul >< 



>< Tru9I 
>< Tfil 

>< Msel 
>< Hinfl 

I < S?lS >< BspWI > < Alul >< Alul 

_CX GAAATGAAXG XXAAGXAXGG — AAGRATAGAG GXCGGAGGGX AG« 

Rmal >< 
> < Mnll 

>< ScaI Mael >< 

>< SfcIX Rsal >K Fnu4H i 

>< BsraAI >< Csp6I ><: AciI 

™| 1g ™ »™s5s m ^fo ~™nas GTCM ™ CC GCCRC ^ 

>< Tru9I 
>< Msel 

GAGCTACTGT GGTAATTGGA AGAAGGAAGT TTTACGGTGG CTGGCATAAT ATGTTAAAAA ™GAG 

Nspl >< 
NspHI >< 
Nlalll >< 
>< Nlalll 

Ddel >< 
BspWI >< 3 
>< Maelll Bfrl X 

TGATGTAGAA ACTCCACACC TTATGGGTTG GGATTATCCA AAATGTGACA GAGGCA.GCG TAACATGCTT 

> < Pall 

> < Haelll 

> ^ >< Mnll >< haelll Sfcl X 

agg™ gc?g^gj ™ggc aaagataaca c™aa CT ™g cgtttctaca 

Tru9I X 

ScrFI > 
Mval > 
X Msel 
Fokl X 
EcoRII >< 
EC1136I > 
DsaV X 
BstOI > 

X Nlalll BstNI > 

> < Fnu4HI BsiLI > 

X AciI Apyl > 



>< MstI 
X HinPlI 
X Hin6I 

> < Hhal 
X Fspl 
>< Fdill 

> < Cfoix Tru9I 
>< Avill >< Msel 



0G T ™ GGAGTG.GGG gS™ GTGAGA.GG, GA TCT GTGGG GGGXGAG^ AXGXTAAAGG 



SfaNI 

X Mspl 
>< Hpall 
x HapH 



x HphI 
X BspWI 



X Tru9I 
X Msel 



Maelll X 
Alul X 



FIGURE 13.35 
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AGGTGGAACA TCATCCGGTG ATGCTACAAC TGCTTATGCT AATAGTGTCT TTAACATTTG TCAAGCTGTT 
15410 15420 15430 15440 15450 15460 15470 

^ _ r , T >< DrdI 

>< BspWI >< Alul > < Acil 

ACAGCCAATG TAAATGCACT TCTTTCAACT GATGGTAATA AGATAGCTGA CAAGTATGTC CGCAATCTAC 

15480 15490 15500 15510 15520 15530 15540 

>< Sau3AI 
>< Ndell 
>< Mbol 
> < MamI 

>< Fbal 
>< DpnII 

>< Dpnl 
X Bspfll 
>< BspAI 

>< Bspl43l 
>< BsiQI 

>< Sfcl > < BsiBlX Nlalll 

X BsmAI > < BsaBIX Fokl 

_ >< Alw26I >< BcllX EcoRI Fokl >< 

AACACAGGCT CTATGAGTGT CTCTATAGAA ATAGGGATGT TGATCATGAA TTCGTGGATG AGTTTTACGC 
15550 15560 15570 15580 15590 15600 15610 

X Tfil 

X SfaNT 
X Nlalll 
X BspMI >< Hin.fi 

TTACCTGCGT AAACATTTCT CCATGATGAT TCTTTCTGAT GATGCCGTTG TGTGCTATAA CMtSSm 
15620 15630 15640 15650 15660 15670 15680 

> < Ritual 
X Nhel >< Tru9I 
X Fnu4HI > < Mael >< Tru9I 

^L AciI ><: AluI >< Msel >< Msel MnlI >< 

GCGGCTCAAG GTTTAGTAGC TAGCAT TAAG AACTTTAAGG CAGTTCTTTA TTATCAAAAT AATGTGTTCA 
15690 15700 15710 15720 15730 15740 15750 

>< Sinl 
>< Sau96I 
>< PssI 
>< Psp5II 
>< PpuMI 
>< NspIV 

X NspHII 
X EcoO109I 
>< Eco4 7l 
X Drall 
X Cfrl3I 
>< BsiZI 
x Ddel >< Bmel8I 

>< Nlalll >< BsmAI >< Avail 

X Ddel >< Alw26I >< AsuI ><c Mn1 T 

TGTCTGAGGC AAAATGTTGG ACTGAGACTG ACCTTACTAA AGGACCTCAC GAATTTTGCT CACAGCATAC 
15760 15770 15780 15790 15800 15810 15820 

>< XhoII 
>< Sau3AI 
>< Ndell 
X Mfll 
X Mbol 
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>< Rsal >< DpnII 

>< Maell >< Dpnl > < Sspl 

>< Tru9I >< Cs P 6I >< BstYI HinPlI >< 

>< ^l'" 9 >< BsaAI >< BspMI Bin 61 > < 

Ma? i >< Afllll x BspAI Hnai 

>< Mael >< Afai >< AlwI>< Bs pl4 3I Cfol >< 

--Hi ^ssi M ™ gtrcc s TR ~s -""sk MTAGG s 

>< Rsal >< sfaNI 

TthHB8I >< Csp6I >< Maelll 

X TtnHBol ^ BsrI >K 

GGCTGTTTTG SSSj-J ™ACA GATGGTACAC AAGGTTCGTG XCACTGGCXA 

> < Fokl 

CCC™ AAACA T CC T A AXCAGGAGJA ,™gx A T ™a 

>< Van91I 
>< PflMI 
>< Nspl 

> < Pall>< NspHI 

> < MscIX Nlalll 

> < Haelll 

> < BsuRI 
>< BsrI 

X Eael >< BslI >< Nspl 

> < BshlX BsiYI >< NspHI * 
>< Nlalll >< Afllll >< Afllll 

w m^tti >< Alul > < BallX AccB7I X Nlalll 

^~ ™™ *~™ss ccaCR i^o SRCRI f^o CCGT Te^ MCTR S 



•5 



>< Rsal> < NlalV 
X Mnll 

>< Csp6I X Ddel . >< Rsal 

X BsrI X Mnll >< Csp6I 

v<r nfaT> < BscBI >< AfaI S 

AACACCTCAC GGTACTGGGA ACCTGAGTTT TATGAGGCTA TGTACACACC ACAXACAG.C TTGCAGGCTG 

>< Nlaiv 

>< EcoNI 
X Eco31I 
X Eco64I>< BsmAI 

X BscBI X BslI 
x BanI >< BsiYI 
X Acil >< Bsal 

X AccBlIX Alw26I Bbvl >< 
»£SSg TGTATTGTGC AA TT CACAGA CT.CACT.CG XTGCGGTGCC XGTAXTAGGA GACCATTCCT 

X Tthllll 

X Fnu4HI >< Nlalll > < Tru9I 

ATGTTGCAAG T^Sc ACC^CAX XTCAACAXCA CACAAATTAG TG.™ XAATCCCXAT 



X ScrFI 
X Mval 



FIGURE 13.37 
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X EcoRII 

>< Ecll36I 
>< DsaV 

>< BstOI 

>< BstNI 

>< BsiLI >< 
>< BsaJI >< MnlI BspWI X 

X Apyl >< Maelll x Maelll x Mael >< Alul 

GTTTGCAATG CCCCAGGTTG TGATGTCACT GATGTGACAC AACTGTATCT AGGAGGTATG AGCTATTATT 
16320 16330 16340 16350 16360 16370 16380 

>< Maelll ■ >< MnlI 

GCAAGTCACA TAAGCCTCCC ATTAGTTTTC CATTATGTGC TAATGGTCAG GTTTTTGGTT TATACAAAAA 
16390 16400 16410 16420 16430 16440 16450 

>< N *P* X Nspl 

X NspHI > < Tthllll >< NspHI 

X Nlallix Maelllx Maelll >< Nlalll 

x Afllll x Aspl >< Afim . 

CACATGTGTA GGCAGTGACA ATGTCACTGA CTTCAATGCG ATAGCAACAT GTGATTGGAC TAATGCTGGC 
16460 16470 16480 16490 16500 16510 16520 

>< Rsal 
x Plel 
X Ddel 
X Csp6I 

x BsmAI X Hinfl >< MnlI 

X Alw26I x Hindlll Ddel x 

>< Afal x Alul X Fnu4HI x Bbvl 

GATTACATAC TTGCCAACAC TTGTACTGAG AGACTCAAGC TTTTCGCAGC AGAAACGCTC AAAGCCACTG 
16530 16540 16550 16560 16570 16580 16590 

> < Thai 

>< Seal 
x Rsal X Rsal 

> < Mvnl 

>< Csp6I X Csp6I 

> < BstUI 

> < Tru9I > < BspSOI 

> < Msel > < Ndel >< Afal >< Afal 

X Alul > < AccII MnlI > 

AGGAAACATT TAAGCTGTCA TATGGTATTG CCACTGTACG CGAAGTACTC TCTGACAGAG AATTGCATCT 
16600 16610 16620 16630 16640 16650 16660 

Maelll X 
x Maelll 
>< Eco0651 
X Eco91I 
X BstPI 

X SfaNI >< Rmal >< BstEII 

x Nlalll x Mael >< BsrI 

TTCATGGGAG GTTGGAAAAC CTAGACCACC ATTGAACAGA AACTATGTCT TTACTGGTTA CCGTGTAACT 
16670 16680 16690 16700 16710 16720 16730 

Rsal X 

^ _ T >< MnlI 

>< Rsal >< Rsal ><: H hI 

X Csp6I >< Csp6l >< SfaNI ■ C sp6I X 

x Afal >< Afal x Maelll >< HphI Afal >< 

AAAAATAGTA AAGTACAGAT TGGAGAGTAC ACCTTTGAAA AAGGTGACTA TGGTGATGCT GTTGTGTACA 

16740 16750 16760 16770 16780 16790 16800 



FTGTTfcF n ^« 
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>< Rsal ><: H P hI 

Z rCfiT >< Hindll Ddel >< 

XAfal >< HincI1 BfrI ~ 

GAGGTACTAC GACATACAAG TTGAATGTTG GT GAT T AC T T TGTGTTGACA TCTCACACTG TAATGCCACT 

16830 16840 16850 16860 16870 



16810 



16820 



>< Vnel 
>< Snol 

>< Sdul 
>< NspII 
>< HgiAI 
>< DraXII 

X Bspl286I 
>< Bmyl 
x ApaLI >< Rmal 
>< Alw4 4I >< Mael 
X Alw21I 



>< 



> < 

> < 

> < 
BspWI 

> < 

> < 

> < 



Sdul 

NspII 

HgiAI 

>< Dralll 
Bspl286I 
Bmyl 
Alw21I 



X 



>< Rsal 
X Csp6I 
BsrI 

X Afal 



Ddel > 



TAGTGCACCT ACTCTAGTGC CACAAGAGCA CTATGTGAGA ATTACTGGCT TGTACCCAAC ACTCAACATC 
16880 16890 16900 16910 16920 16930 16940 



Styl X 

SinI > 
Sau96I > 
NspIV > 
EcoT14I >< 

Eco47I > 
Ecol30I >< 
>< Seal Cfrl3I > 
BssTlI >< 
>< SphI >< Rsal BsiZI > 
>< Pael BsaJI >< 

>< Nlalll Bmel8I > 

>< Rmal >< NspIX Csp6I Avail > 

>< Mael ><c NspHlX Afal Asul > 

TCAGATGAGT TTTCTAGCAA TGTTGCAAAT TATCAAAAGG TCGGCATGCA AAAGTACTCT ACACTCCAAG 
16950 ~ 16960 16970 16980 16990 17000 17010 



>< ScrFI 

x Rsal 
x Mval 
X EcoRII 
X EC1136I 

> < Csp6I 
X BstOI 
X BstNI 
X Xcml >< BslI 
X NspHII X BsiYI 
X BsiLI 

X Apyl >< BsrI 
>< DsaVX Afal > < HinfIX Plel 
GACCACCTGG TACTGGTAAG AGTCATTTTG CCATCGGACT TGCTCTCTAT TACCCATCTG CTCGCATAGT 
17020 17030 17040 17050 17060 17070 17080 



X SfaNI 
X SphI >< PvuII 

>< Pael >< Psp5I 

>< Nspl- >< NspBII 

X NspHI >< Fnu4HI > < Tru9I 

>< Bstll07I > < NlalllX BspWI m >< Ssp 1 

>< AccI ' >< Nlalll • X Alul >< Bbvl ' > < Msel ^ m ^ m 

GTATACGGCA TGCTCTCATG CAGCTGTTGA TGCCCTATGT GAAAAGGCAT TAAAATATTT GCCCATAGAT 
17090 17100 17110 17120 17130 17140 17150 

FIGURE 13.39 
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>< 



>< 



> 

Thai 

> 

Mvnl 

> 



< Thai 



< Mvnl 
>< Thai 

< HinPlI 
>< HinPH 

>< HinPlI >< Mvnl 

> < Hin61 
>< Hin61 

> < Hhal 
>< Hhal >< Hhal 

> < Cfol 
>< Cfol >< Cfol 

> < BstUI 
>< BstUI >< BstUI 

>< BssHII 
>< BspMI 

> < BspSOI 

>< BspSOlx BspSOI Rmal > 

>< Tfil >< Hin6I> < AccII Mael > 

>< Hinfl >< AccII X AccII > < EcoRI 

AAATGTAGTA GAATCATACC TGCGCGTGCG CGCGTAGAGT GTTTTGATAA ATTCAAAGTG AATTCAACAC 
17160 17170 17180 17190 17200 17210 17220 



>< Bsgl 



>< Zsp2I 
>< PpulOI 

>< Nsil 
>< Mphll03I 
>< EcoT22I 
> < Avalll 



>< DrdI 



TAGAACAGTA TGTTTTCTGC ACTGTAAATG CATTGCCAGA AACAACTGCT GACATTGTAG TCTTTGATGA 



17230 



17240 



17250 



17260 



17270 



17280 



17290 



>< Rmal 

>< Mael x Maell 

AATCTCTATG GCTACTAATT ATGACTTGAG TGTTGTCAAT GCTAGACTTC GTGCAAAACA CTACGTCTAT 
17300 17310 17320 17330 17340 17350 17360 

>< Sau3AI 
X Ndell 
X Mfaol 
X DpnII 
>< Dpnl 

X BspAI X Rmal 

X AlwIX Bspl4 3I > < Acil >< Mael Sspl x 

ATTGGCGATC CTGCTCAATT ACCAGCCCCC CGCACATTGC TGACTAAAGG CACACTAGAA CCAGAATATT 



17370 



17380 



17390 



>< Tru9I 
>< Msel 



17400 

>< SinI 
X Sau96I 
X NspIV 

X NspHII 
X Eco47I 
X Cfrl3I 
x BsiZI 
x Bsgl 
X Bmel8I 
X Avail 
X Asul> < 



17410 17420 



X Styl 

>< Nspl 

X NspHI 

X Nlalll 

X EcoT14I 
X Ecol30I 
X BssTlI 
X BsaJI 
Afllll 



17430 



TTAATTCAGT GTGCAGACTT ATGAAAACAA TAGGTCCAGA CATGTTCCTT GGAACTTGTC GCCGTTGTCC 
17440 17450 17460 17470 17480 17490 17500 



mm n>t? to a n 
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>< Hindu 

>< Hindi >< AiuI 

TGCTGAAATT GTTGACACTG TGAGTGCTTT AGTTTATGAC AATAAGCTAA AAGCACACAA GGATAAGTCA 
17510 17520 17530 17540 17550 17560 17570 

X Alul >K Nl aI11 

GCTCAATGCT TCAAAATGTT CTACAAAGGT GTTATTACAC ATGATGTTTC ATCTGCAATC AACAGACCTC 
17580 17590 17600 17610 17620 17630 17640 

>< Mnll 
X EcoNI 

X BslI H P hI 
>< BsiYI ><c AluI 

AAATAGGCGT TGTAAGAGAA TTTCTTACAC GCAATCCTGC TTGGAGAAAA GCTGTTTTTA TCTCACCTTA 
17650 17660 17670 17680 17690 17700 17710 

>< Sfcl >< Ddel >< Tfil 

> < Alul X Bfrl >< Hinfl 

TAATTCACAG AACGCTGTAG CTTCAAAAAT CTTAGGATTG CCTACGCAGA CTGTTGATTC ATCACAGGGT 
17720 17730 17740 17750 17760 17770 17780 



> < 

> < 



Hindll 
Hindi 
X Acil 



X Tthllll 
X Aspl 

TCTGAATATG ACTATGTCAT ATTCACACAA ACT ACT G AAA CAGCACACTC TTGTAATGTC AACCGCTTCA 
17790 17800 17810 17820 17830 17840 17850 



X XhoII 
X Sau3AI 

>< Ndell \ m 
X Mfll \ 
X Mbol 
X MamI 
X DpnII 

x Dpnl 
X BstYI 
X BspAI 

x Bspl43I 
X BsiBI 
X BsaBI 
X BspWI >< Bglll 

ATGTGGCTAT CACAAGGGCA AAAATTGGCA TTTTGTGCAT AATGTCTGAT AGAGATCTTT ATGACAAACT 
17860 17870 17880 17890 17900 17910 17920 



X Xbal 

X Rmal >< Maelll 

>< Mael X Maell BsrI >< 

GCAATTTACA AGTCTAGAAA TACCACGTCG CAATGTGGCT ACATTACAAG C AG AAAATG T AACTGGACTT 



17930 



17940 



17950 



17960 



17970 



17980 



17990 



X Tru9I 

x Mseix Sfd 



X Sau3AI 
X Ndell 

x Mbol I 
>< Mbol 

> < Fokl 
>< DpnII 

X Dpnl 
>< BspAI 

X Bspl4 3I 

X Bbsl > < 



BsrI 



>< NlalV 
X Eco64I 

X BscBI 
X BanI 
X AccBlI 



*MnlI X 
X Ddel 



FIGURE 13. 41 



1er depot 



55/83 



TTTAAGGACT GTAGTAAGAT CATTACTGGT CTTCATCCTA CACAGGCACC TACACACCTC AGCGTTGATA 
18000 18010 18020 18030 18040 18050 18060 

>< ScrFI 
>< Mval 
>< EcoRII 
>< Eco57l 

>< Ecll36I 
>< DsaV 
>< BstOI 
>< BstNI 
>< HindllX BsiLI 
>< Hincllx Apyl 



>< Plel 
>< Nlalll 

Hinfl >< 
AccI >< 



TAAAGTTCAA GACTGAAGGA TTATGTGTTG ACATACCAGG CATACCAAAG GACATGACCT ACCGTAGACT 
18070 18080 18090 18100 18110 18120 18130 



>< Maelll 
X Eco0651 
>< Eco91I 
>< BstXI 

>< BstPI 
>< BstEII 



Thai >< 
Mvnl >< 
BstUI >< 
BspSOI >< 

>< Acil 
>< HphI AccII >< 



CATCTCTATG ATGGGTTTCA AAATGAATTA CCAAGTCAAT GGTTACCCTA ATATG?TTAT A SScGCGAA 

18140 18150 18160 18170 18180 18190 18200 

>< XmnI 

^ . . . >< SfaNI 

> < Maelll D _ 

>< Asp700I : RmaI 

XAluI XMaell > <MnlI ><N x"aeI 

GAAGCTATTC GTCACGTTCG TGCGTGGATT GGCTTTGATG TAGAGGGCTG TCATGCAACT AgIgATGCTG 

18210 18220 18230 18240 18250 18260 18270 



>< Rsal 
>< Gsul 

X Csp6I 
>< Bpml 
x Afal 



x RmaI 

>< Mnll 
>< Mael 
X Alul 



>< Sfcl 



>< Tru9I 
X Msel 
>< Hpal 

>< Hindll x Rsal 

>< Hindi x Csp6l 

x Ddel X Alul BsrI x 
X Bfrl x Afal 



TGGGTACTAA CCTACCTCTC CAGCTAGGAT TTTCTACAGG TGTTAACTTA GTAGCTgSc^GACTGGTTA 
18280 18290 18300 18310 18320 18330 18340 

>< ScrFI 
>< Mval 

>< Mnll 
X Maelll 
X EcoRII 

X Ecc-0651 
>< EcoNI 

X Eco91I 
>< Ecll36l 
X DsaV Tru9I X 
>< Drain 
X BstPI 
>< BstOI 

>< BstNI Pmel X 

>< BstEII 

>< BslI Msel X 

>< BsiYI HphI x 

Tru91 >< BsiLI Dral X 

>< Msel >< ApyI ><c BsrI 

FTHTTPP 11 /I o 



>< Hindll 
>< Hindi 



>< HphI 

X EcoRI 
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TGTTGACACT GAAAATAACA CAGAATTCAC CAGAGTTAAT GCAAAACCTC CACCAGGTGA CCAGTTTAAA 
18350 18360 18370 18380 18390 18400 18410 

>< ScrFI 

>< Mval 
>< EcoRII 

X EC1136I 
>< DsaV 

>< BstOI 

>< BstNI >< Rsal 

>< BsiLI Ddel >< 

>< BsaJI > < Tru9I>< Csp6I 

>< Nlalll >< Apyl > < Msel X Afal 

CAT CT TAT AC CACTCATGTA TAAAGGCTTG CCCTGGAATG TAGTGCGTAT TAAGATAGTA CAAATGCTCA 
18420 18430 18440 18450 18460 18470 18480 

>< Nlalll 
X HinPlI 
>< Tthllll >< Hin6I 

>< Hinfl > < Hhal 

>< Aspl >< Plel > < Cfol >< Alul 

GTGATACACT GAAAGGATTG TCAGACAGAG TCGTGTTCGT CCTTTGGGCG CATGGCTTTG AGCTTACATC 
18490 18500 18510 18520 18530 18540 18550 

>< SinI 
>< Sau96I 
>< NspIV 

>< NspHII 
X Eco47I 
>< Cfrl3I 
X Seal >< BsiZI 

x Rsal X Bmel8I V 

x Csp6I X Avail X Maell 

X Afal >< Asul >< Afllll X Maellix Maell 

AATGAAGTAC TTTGTCAAGA TTGGACCTGA AAGAACGTGT TGTCTGTGTG ACAAACGTGC AACTTGCTTT 
18560 18570 18580 18590 18600 18610 18620 

> < Tfil >< Tthllll 

> < Hinfl > < Aspl 

TCTACTTCAT CAGATACTTA TGCCTGCTGG . AATCATTCTG TGGGTTTTGA CTATGTCTAT AACCCATTTA 
18630 18640 18650 18660 18670 18680 18690 

X ScrFI 
Rsal X 
X Mval 
X EcoRII 
Ecll36I X 

X DsaV 
Csp6I x 

BstXI X 

> < Maelll X BstOI 

> < Eco0651 X BstNI 

> < Eco91I >< BsiLI 

> < BstPI >< Apyl 
X Eco57I> < BstEII >< Maelll >< Nlalll Afal X 

TGATTGATGT TCAGCAGTGG GGCTTTACGG GTAACCTTCA GAGTAACCAT GACCAACATT GCCAGGTACA 
18700 18710 18720 18730 18740 18750 18760 

X SfaNI 
>< Rmal 
X Nspl 
>< NspHI 

FIGURE 13.43 
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>< Nlalll >< Rma! 

>< Mael >< Nlalll Tru9I X 

>< Nlalll >< BspWI >< MaeI >K NlaIII 91 

> < AflHI >< BspHI 

TGGAAATGCA CATGTGGCTA GTTGTGATGC TATCATGACT AGATGTTTAG CAGTCCATGA GTGCTTTGTT 
18770 18780 18790 18800 18810 18820 18830 

>< Thai 

>< Mvnl 
>< HinPlI 
>< Hin6I 

>< Hhal 

>< Cfol 

X BstUI >< EcoNI> < Mnll 

>< BspSOI >< BslI >< Tru9I 

_ AccII >< BsiYI >< Ddel >< Msel 

AAGCGCGTTG ATTGGTCTGT TGAATACCCT ATTATAGGAG ATGAACTGAG GGTTAATTCT GCTTGCAGAA 
18840 18850 18860 18870 18880 18890 18900 

>< Rsal 

X Csp61 > Mb NiaTTT 

X Afal >< Nlalll >< B spWI >< BsrI >< BsdHI 

AAG T AC AAC A CATGGTTGTG AAGTCTGCAT TGCTTGCTGA TAAGTTTCCA GTTCTTCATG ACATTGGAAA 
18910 18920 18930 18940 18950 18960 18970 

X Saul 
X MstlX 
X Eco81I 

>K DdeI Nlalll >< 

CvnI X Espl 

x Bsu36I >< Eco57I Maelll >< 

>< Bse21I >< DdeI 

Ax y r >< Celll 

x AocI x Mnll >< SfaNX >< BDniin?T 

TCCAAAGGCT ATCAAGTGTG TGCCTCAGGC TGAAGTAGAA TGGAAGTTCT ACGATGCTCaScCATCTAGT 
18980 18990 19000 19010 19020 19030 19040 

>< Mnll >< Ksp632I 

X Hindlll >< EarI 

>< Alul >< MboII >< Eamll04I 

gacaaagctt acaaaataga ggaactcttc tattcttatg ctacacatca cgataaattc actgatggtg 

19050 19060 19070 19080 19090 19100 19110 

>< Sau3AI 
>< Ndell 
>< Mbol 
>< MaeII> < Maelll 
>< DpnII 
>< Dpnl 

X BspAI Hinf I > 

>< Maelll x Bspl4 3I >< Muni n^wr w 

tttgtttgtt ttggaattgt aacgttgatc gttacccagc caatgcaatt gtgtgtaggt ttgaS^g 

19120 19130 19140 19150 19160 19170 19180 

Zsp2I X 

>< SphI 
> < PpulOI 
>< Pael 

_ 0 „ >< Nspl 

>< ScrFI _ X1 t t t 

>< Mval ^ tviiIt-pt 

>K EcoRI1 Mphll03I x 
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„ „,,. >< Gsul 

>< EC1136I ECOT22I >< 

>< o 4-r>T >< Bsml 

^ >< BscCI 

™ TGATGGTGGT ™ — « *™C 

>< Tru9I 

> < Muni 

X TthHB8I >< MseI 

>< Bcgl/a >< Taql >< Jral 

~£;™G — »™ CTTTTACTAT T CX~ 

SfaNI >< 

>< PJ- eI >< Maell 

>< NlaI11 BsaAI >< 

X BsmAI AflHI >< 

CTI G^S^G_, CGG™ ™™ C~G CT — 

Zsp2I > 
>< Seal 

PpulOI >< 
>< RsalNsil > 
Mphll03I > 
>< SfaNIEcoT22I > 
> < Rsal >< Csp6I 
>< Csp6I Avail I >< . 

>< NlaIII> < Afal >< Afal 
TAGACGAXGC AATTTAGGTG GTGCTGTTTG CAGAGACCA* GCAAATGAGT ACCGACAGTA CTTGGATGCA^ 

tataatmga°tgatttctgc tgga„tagg g T a™ acaaacaatt T ga™ AACCTGXGGA 

>< ScrFI 

>< Mval 

>< Maelll 
>< EcoRII 

>< EC1136I 
>< DsaV 

>< BstOI 

>< BstNI >K Tru9I 

f sx " X MseI 

ATACATTTAC GAGgSScAG AG^AGAAA ATGTGGCTXA AATAAAGGAC ACTTTGATGG 

>< SgrAl 
>< Nael 

X Mspl > < Vs P* 

X Hpall > < Tru9I 

X HapH > < Mse * 

x CfrlOI > < AsnI 

ACAGGGGGGC SJSSjC ^GCATCA* ^«CT G ITI ACAGAA AGG.AGATGG ™GTG 

FIGURE 13. 45 
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>< XhoII 
>< Sau3AI 
>< Ndell 
>< Mfll 
X Mbol 
>< DpnII 

>< Dpnl 
>< BstYI 
>< BspAI 

>< Bspl4 3I 
>< Bglll 



>< Tru9I 

>< Msel >< Alul 

GAGATCTTTG AAAATAAGAC AACACTTCCT GTTAATGTTG CATTTGAGCT TTGGGCTAAG CGTAACATTA 
19680 19690 19700 19710 19720 19730 19740 



>< Maelll 
>< Espl 

>< DdeITru9I >< 
>< CelllMsel >< 
>< Bpull02I 



>< Fnu4HI 

>< Tru9I >< EcoRV 

>< BsrI X Msel >< Bbvl >< Eco32I 

AACCAGTGCC AGAGATTAAG ATACTCAATA ATTTGGGTGT TGATATCGCT GCTAATACTG TAATCTGGGA 
19750 19760 19770 19780 19790 19800 19810 

>< Nspl 
>< NspHI 
>< Nlalll 
>< Bsgl 
>< Afllll 

CTACAAAAGA GAAGCCCCAG CACATGTATC TACAATAGGT GTCTGCACAA TGACTGACAT TGCCAAGAAA 
19820 19830 19840 19850 19860 19870 19880 

X DdelX Mbol I >< AccI 

CCTACTGAGA GTGCTTGTTC TTCACTTACT GTCTTGTTTG ATGGTAGAGT GGAAGGACAG GTAGACCTTT 
19890 19900 19910 19920 19930 19940 19950 

SinI >< 
Sau96I >< 
NspIV >< 
NspHII >< 
NlalV >< 
Eco47I >< 
Cfrl3I >< 

>< BslI 
BsiZI >< 

>< BsiYI 
BscBI >< 
Bmel8I >< 

>< Tru9l Avail >< 

>< Msel Asul >< 

TTAGAAACGC CCGTAATGGT GTTTTAATAA CAGAAGGTTC AGTCAAAGGT CTAACACCTT CAAAGGGACC 
19960 19970 19980 19990 20000 20010 20020 



X Rmal 
>< Nhel 
>< Mael 
>< Hgaix Alul 



>< Vspl 
>< Tru9I 
>< Plel 
>< Msel 
>< Maelll 

>< Asnl 
>< HinfIX Asel 



>< Tfil 
X Hinfl 



Tru9I >< 
x Tru9I 

Msel X 
X Msel 



AGCACAAGCT AGCGTCAATG GAGTCACATT AATTGGAGAA TCAGTAAAAA CACAGTTTAA CTACTTTAAG 
20030 20040 20050 20060 20070 . 20080 20090 



X Ddel x Mnll Tru9I X 
>< BsmAI >< Ddel 
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>< Alw26I >< BfrlMsel >< 

™™ T S RCRGT S G ™S TTiCT ^ °-5SS """SIS 



>< 
>< 



>< Xcml 
>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 

>< Dpnl 
X BspAI 

X Bspl43I 
AGCCCAGATC ACAAATGGAA 
20170 20180 



> 
> 

> 
> 
> 
> 



< 
< 

< 
< 
< 
< 
< 



TthHB8I 

TaqI 
>< 
>< 
>< 

PaeR7I 
NspIII 
>< 
X 

Eco88I 
XhoIX 



SstI 
Sdul 
SacI 



NspII 
HgiAI 



Xhol >< 
TthHB8I > 
TaqI > 
Slal X 
PaeR7I >< 
NspIII >< 
>< Mnll 

Eco24I Eco88I >< 

>< Ecll36II CcrI >< 

SlalX Bspl286I BspWI X 

CcrIX Bmyl Bco1 >< 

Bcoix Banll > < Bcgl/a 

Ama87I Aval >< 

AvalX Alw21I Ama87I X 

X Alul X EcoRI X FoklAluI X 

ACTGACTTTC TCGAGCTCGC TATGGATGAA TTCATACAGC GATATAAGCT 
20190 20200 20210 20220 20230 



>< TthHB8I 
>< TaqI . 
X Sful 
X NspV 
X Lspl 

X Csp45I ;< 
X BstBI ? . 
X Bspll9I K ^ 
>< BsiCI >K Mbo11 

I I ill >< BbsI Tru91 >< 

>< Kull x Bcgl >< Nlalll >< AcilMsel x 

CGAGGGCTAT GCCTTCGAAC ACATCGTTTA TGGAGATTTC AGTCATGGAC AACTTGGCGG TCTTCATTTA 
20240 20250 20260 20270 20280 20290 20300 

>< HphI 
X HinPlI 
X Hin6I 
X Espl > < Hhal X Tfil 

>< Ddel >< Haell 

>< Celll >< Eco47III 
X Bpull02I > < Cfol >< Hinfl 
>< Bfrl >< Bspl43II 



X 
X 
X 



Tru9I 
Msel 
Mnll 



ATGATAGGCT TAGCCAAGCG CTCACAAGAT TCACCACTTA AAT T AG AGG A TTTTATCCCT ATGGACAGCA 



20310 



20320 



CAGTGAAAAA TTACTTCATA^" ACAGATGCGC* AAACAGGTTC ATCAAAATGT GTGTGTTCTG TGATTGATCT 
20380 20390 20400 20410 20420 20430 20440 



20330 

>< MstI 
>< HinPlI 
X Hin6I 
>< Hhal 
>< Fspl 
X Fdill 
X Cfol 
X Avill 



20340 



20360 



20370 



Sau3AI >< 
Ndell >< 
Mbol x 
DpnII >< 

Dpnl X 
BspAI X 
Bspl4 3I X 



X TthHB8I 



FIGURE 13.4 7 
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>< Tthllll 
>< TaqI 

>< Aspl > < Maelll Maelll >< 

TTTACTTGAT GACTTTGTCG AGATAATAAA GTCACAAGAT TTGTCAGTGA TTTCAAAAGT GGTCAAGGTT 
20450 20460 20470 20480 20490 20500 20510 

>< Nspl 
>< NspHI 
>< Nlalll 
>< Fokl 

>< Muni > < Nlalll >< Afllll 

ACAATTGACT ATGCTGAAAT TTCATTCATG CTTTGGTGTA AGGATGGACA TGTTGAAACC TTCTACCCAA 
20520 20530 20540 20550 20560 20570 20580 

>< SfaNI 

X ScrFI 

>< Mval 
>< EcoRII 

>< Ecll36I 
>< DsaV 

>< BstOI >< SfaNI 

>< BstNI >< Rsal BspWI >< 

>< BsiLI > < Csp6I Bsml > 

>< BspWI >< Apyl >< A fal BscCI >< 

AACTACAAGC AAGTCAAGCG TGGCAACCAG GTGTTGCGAT GCCTAACTTG TACAAGATGC AAAGAATGCT 
20590 20600 20610 20620 20630 20640 20650 

X Eco57I X Maelll >< HphI 

TCTTGAAAAG TGTGACCTTC AGAATTATGG TGAAAATGCT GTTATACCAA AAGGAATAAT GATGAATGTC 
20660 20670 20680 20690 20700 20710 20720 

> < Rsal 
X Csp6I 

x Bstll07I >< Tru9I >< Alul 

>< AccI >< Ms ei > < AfalNlalll >< 

GCAAAGTATA CTCAACTGTG TCAATACTTA AATACACTTA CTTTAGCTGT ACCCTACAAC ATGAGAGTTA 
20730 20740 20750 20760 20770 20780 20790 

>< ScrFI 

>< Rsal 
>< Mval 
X EcoRII >< NspBII 

X Ecll36l >< Sdul 

> < Csp6l >< NspII 

X BstOI X PvuIlX HgiAI 
X BstNI >< Ddel 

>< BsiLI X PspSIX Bspl286l 
>< Apyl >< Alul X Bmyl 
x DsaVx Afal >< Alw21I 

TTCACTTTGG TGCTGGCTCT GATAAAGGAG TTGCACCAGG TACAGCTGTG CTCAGACAAT GGTTGCCAAC 
20800 20810 20820 20830 20840 20850 20860 

X XhoII 

>< Tru9I 
>< Sau3AI 
X Ndell 
>< TthHB8I x Msel 
>< Mfll 
>< Mbol 
« *' >< Maml 

X DpnII 
X Tfil >< Dpnl 
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TGGCACACTA CTTGTCGATt" CAGATCTTAA TGACTTCGTC TCCGACGCAG ATTCTACTTT AATTGGAGAC 



>< BstYI 
>< BspAI 
>< HinflX Bspl43I 
>< BsiBI 
X BsaBI 
>< TaqI >< Bglll >< 



>< 



>< 
Tthllll 
>< 

Aspl >< 



> 
> 

Esp3I 

>< BsmBI 
BsmAI 



Tfil 
Hinfl 



>< 
>< 
> 



Tru9I 

Msel 

< BsmAI 



Alw26I >< Hgal> < Alw26I 



20870 



20880 



>< Rsal 
> < Csp6I 
>< Afal 



20890 



20900 



< SinI 

< Sau96I 

X PssI 
>< Psp5II 

< PpuMI 

< NspIV 
>< NspHII 
X NlalV 

< EcoO109I 

< Eco47I 

< Drall 

< Cfrl3I 

< BsiZI 
>< BscBI 

< Bmel8I 

< Avail 

< Asul 



20910 



20920 



20930 



TGTGCAACAG TACATACGGC TAATAAATGG GACCTTATTA 
20940 20950 20960 20970 



X Styl 

X SinI 
X Sau96I 
>< Rmal 

>< NspIV 
NspHII >< 
>< Mael 

>< EcoT14I 

>< Eco47I 

>< Ecol30I 

X Cfrl3I 

X BssTlI 

>< BsiZI 

X BsaJI 

X Bmel8I 

X Blnl 

>< Avrll 

x Avail 
X Asul 
AflHI X' 

TTAGCGATAT GTATGACCCT AGGACCAAAC 
20980 20990 21000 



X Nspl 
X NspHI 

x Nlalll X Plel ^ 

>< Maelll >< Hinfl Mael >< 

ATGTGACAAA AGAGAATGAC TCTAAAGAAG GGTTTTTCAC TTATCTGTGT GGATTTATAA AGCAAAAACT 

21010 21020 21030 21040 21050 21060 21070 

X.ScrFI 

X Mval 
X EcoRII 

x EC1136I 
X DsaV 

X BstOI 

X BstNI 

X BsiLI 
X BsaJI 

X BsaJI >< Sfcl >< BsmI X BsmI 

X Apvl > < Alul X BscCI >< BscCIHindHI XX Alul 

AGCCCTGGGT GGTTCTATAG CTGTAAAGAT AACAGAGCAT TCTTGGAATG CTGACCTTTA CAAGCTTATG 
21080 21090 21100 21110 21120 21130 21140 

X Zsp2I 
>< PpulOI 

X Pall ><: NsiI 

>< Haelll Mphll03I Tru9I >< 

>< esuRI >< Maelll >< EcoT22I X Msel 

x BshI >< Nlalllx Alul >< Bcgl >< Avalll X SfaNIBcgl/a >< 

GGCCATTTCT CATGGTGGAC AGCTTTTGTT ACAAATGTAA ATGCATCATC ATCGGAAGCA TTTTTAATTG 
2U50 21160 21170 21180 21190 21200 ■ 21210 



Sau96I 
NspIV 

Cfrl3I 
BsiZI 
Asul 



FIGURE 13.4 9 
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>< Zsp2I 
>< SphI 
>< PpulOI 

>< Pael 
>< Nspl 
>< NspHI 

>< Nsil 
>< Nlalll 
> < Nlalll 

X Mphll03I 

>< EcoT22I 

„„„ ■ > < Avalll >< Mnll 

GGGCTAACTA TCTTGGCAAG CCGAAGGAAC AAATTGATGG CTATACCATG CATGCTAACT ACATT TTCTG 
21220 21230 21240 21250 21260 21270 21280 

Tru9I >< 

X Mboll >< Tru9I 

GsuI Msel >< 

>K BsrI X Msel 

>< Bpml MnlI >K 

X Bi>sl >< Nlalll x Mnll 

GAGGAACACA AATCCTATCC AGTTGTCTTC CTATTCACTC TTTGACATGA GCAAATTTCC TCTTAAATTA 

21350 



21290 21300 21310 21320 21330 ~ 21340 



X Tru9I 
>< MseX 
X Esp4I> < Tfil 

. >< BsmAI Ksp632l X 

X Alw26I >< Mboll >< Earl 

nrnrrA?v _ >< AflII> < Hinfl Eamll04I >< 

AGAGGAACTG CTGTAATGTC TCTTAAGGAG AATCAAATCA ATGATATGAT TTATTCTCTT CTGGAAAAAG 
21360 21370 21380 21390 21400 21410 21420 

>< Tru9I 
>< Msel 
X Hindll 
>< Hindi 

GTAGGCTTAT CATTAGAGAA AACAACAGAG TTGTGGTTTC AAGTGATATT C TTGTTAACA^CT AAAC GAA 
21430 21440 21450 21460 21470 21480 21490 

>< Vnel 
>< Snol 

X Sdul 
>< NspII 
>< Hpall 

X HgiAI 
>< HapII 
X CfrlOI 

X Bspl286I 

w K 7er ,T ><C Ms P x >< Bmyl 

It P T ><: SpeI >< A P^I 

y< Ns P HI X Rmal >< A lw4 4I 

X Nlalll >< Mae i >< Maelll x Agel X Alw21I 

CATGTTTATT TTCTTATTAT TTCTTACTCT CACTAGTGGT AGTGACCTTG ACCGGTGCAC CACTTTTGAT 
21500 21510 21520 21530 21540 21550 21560 

> < Alul >< Mnll 

GATGTTCAAG CTCCTAATTA CACTCAACAT ACTTCATCTA TGAGGGGGGT TTACTATCCT GATGAAATTT 
21570 21580 21590 21600 21610 21620 21630 



>< Sau3AI 
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>< Ndell 
X Mbol 
X DpnII 

x Dpnl >< Tru9I 

>< BspAI >< Msel > < MboII 

>< Bspl4 3I >< Ddel >< Maelll 

TTAGATCAGA CACTCTTTAT TTAACTCAGG ATTTATTTCT TCCATTTTAT TCTAATGTTA CAGGGTTTCA 
21640 21650 21660 21670 21680 21690 21700 

X Vspl 
X Tru9I 
X Msel 

>< Asnl >< Tru9I >< Fokl 

>< Asel >< Maell >< Msel >< Bbvl > < Fnu4HI 

TACT AT T AAT CATACGTTTG GCAACCCTGT CATACCTTTT AAGGATGGTA TTTATTTTGC TGCCACAGAG 
21710 21720 21730 21740 21750 21760 21770 

>< BslI 

X Dsalx BsiYI >< Nlalll 

>< BsaJI > < Maelll 

AAATCAAATG TTGTCCGTGG TTGGGTTTTT GGTTCTACCA TGAACAACAA GTCACAGTCG GTGATTATTA 
21780 21790 21800 21810 21820 21830 21840 

>< Nspl 

>< Tru9I >< NspHI 

>< Msel >< Nlalll 

>< HphI >< Maelll >< Maelll 

TTAACAATTC TACTAATGTT GTTATACGAG CATGTAACTT TGAATTGTGT GACAACCCTT TCTTTGCTGT 
21850 21860 21870 21880 21890 21900 21910 

>< Styl >< Zsp2I 

>< Nlalll >< Tru9I V 

>< Ncol >< Rsal >< PpulOI TthHB8X >< / 

>< EcoT14I >< Nsil >< Taql' 

>< Ecol30I >< Msel SfaNI >< 

>< Dsalx Csp6I X Mphll03I Rsal X 

>< BssTlI X TthHB8I X EcoT22I Csp6I X 

X BsaJIX Afal >< Taql >< Avalll Afal >< 
TTCTAAACCC ATGGGTACAC AGACACATAC TATGATATTC GATAATGCAT TTAATTGCAC TTTCGAGTAC 

21920 21930 21940 21950 21960 21970 21980 

X Tru9I 
X Msel 
>< Dral 

ATATCTGATG CCTTTTCGCT TGATGTTTCA GAAAAGTCAG GTAATTTTAA ACACT T AC G A GAGTTTGTGT 
21990 22000 22010 22020 22030 22040 22050 

X Sau3AI 
>< Ndell 
X Mbol 
>< DpnII 

>< Tru9I >< Dpnl 

X Msel X BspAI 

X Dral >< Sf cl Bspl4 3I >< 

TTAAAAATAA AGATGGGTTT CTCTATGTTT ATAAGGGCTA TCAACCTATA GATGTAGTTC GTGATCTACC 
22060 22070 22080 22090 22100 22110 22120 

x Tru9I 

x Tru9I > < Tru9I >< Msel 

X Msel > < Msel >< Mnll 

TTCTGGTTTT AACACTTTGA AACCTATTTT TAAGTTGCCT CTTGGTATTA ACATTACAAA TTTTAGAGCC 
22130 22140 22150 22160 22170 22180 22190 



FTGTTRF IT 51 
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> < SduIX Sfcl 

>< PvuII 
>< PspSI 

> < NspII 

>< NspBII 

> < Maell > < Fnu4HI 

> < Bspl286I >< PstI Tru9I > 
>< BspMI > < BmylX Fnu4HI Msel > 

>< HphI >< Bbvl >< Alul >< Bbvl 

ATTCTTACAG CCTTTTCACC TGCTCAAGAC ATTTGGGGCA CGTCAGCTGC AGCCTATTTT GTTGGCTATT 
22200 22210 22220 22230 22240 22250 22260 

>< SfaNI 
X Rsal 

> < Csp6I 

>K DraI >< Afal >< AlwNI 

TAAAGCCAAC TACATTTATG CTCAAGTATG ATGAAAATGG TACAATCACA GATGCTGTTG ATTGTTCTCA 
22270 22280 22290 22300 22310 22320 22330 

> < Tru9I 

> < Msel 

>< Alul 

AAATCCACTT GCTGAACTCA AATGCTCTGT TAAGAGCTTT GAGAT TGACA AAGGAATTTA CCAGACCTCT 
22340 22350 22360 22370 22380 22390 22400 

>< Saul 
>< Mstll 
x Eco81I 
>< Ddel 
X Cvnl 
X Bsu36I 
>< Bse21I 

X Axyl >< Tfil 

>< Mnll >< AocI X Mnll X Hinfl X Sspl >< Mnll 

AATTTCAGGG TTGTTCCCTC AGGAGATGTT GTGAGATTCC CTAATAT T AC AAACTTGTGT CCTTTTGGAG 
22410 22420 22430 22440 22450 22460 22470 

X Zsp2I 
>< PpulOI 

>< Nsil 

> < Nlalll 
X Mphll03I 

x Tru9I >< EcoT22I 

X Msel >< Avalll 

AGGTTTTTAA TGC TACT AAA TTCCCTTCTG TCTATGCATG GGAGAGAAAA AAAATTTCTA ATTGTGTTGC 
22480 22490 22500 22510 22520 22530 22540 

>< Sdul 
x NspII 
X HgiAI 
X Bspl286I 

>< Bmyl >< Tru9l 

>< Alw21I >< Msel Ddel X 

TGATTACTCT GTGCTCTACA ACTCAACATT TTTTTCAACC TTTAAGTGCT ATGGCGTTTC TGCCACTAAG 
22550 22560 22570 22580 22590 22600 22610 

>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 
x Dpnl 
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x BspAI T< SSi 

>< Bspl43I _„„ rTrTaT gcaGATTCTT TTGTAGTCAA GGGAGATGAT GTAAGACAAA 

TTGAATGATC TTTGCTTCTC CAATGTCTAT GCAGATTCTT 226QQ 

X ScrFI 
>< Mval 
>< HinPlI 
>< Hin6I 
>< Hhal 

>< Haell 
>< EcoRII 

x Ecll36I 
>< DsaV 
>< Cfol 
>< BstOX 
>< BstNI 
>< Bspl43II 

>< BsiLI >< Nialll 

-c^S-ss ™- — » »-S3 SAT ™ TG ™ 

>< sfaNI Ddel X 

>< K* 1 * 1 X BsrI Bfrl >< 

CCTTGCTTGG ^-CT GG.™ ™*™ 

>< Sau96I 

>< Pall 
>< NspIV 
> < Hindlll 

>< Haelll 
>< EcoO109I 
>< Drall 
>< Ddel 

>< Cfrl3I 
>< BsuRI 
>< BsiZI 
>< BshI 
X Bfrl >< PssI 

X Nialll >< AsuIX BsniAI BspWI X 

MS ™ ££ScC C^ 1 — „ CTCCCCTGRT 

X Tru9I 
x Pall 
X MscI 
X Haelll 
>< Eaeix Msel 
X Tru9I >< BsuRI 

x Msel >< BshI 

BsrI X 

GCACCCCRCC TGCTCTTAA^TGTTATTGGC ™™ TftCRCCRCTA c™gg 



Sau961 >< 
x PallNspIV >< 
> < Mspl NspHII >< 
X Haelll 



FIGURE 13.53 
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> < Hpall Eco4 7I >< 

>< Dsal 

> < HapII Cfrl3l >< 

>< BsuRISinX >< 
>< Gdill BsiZI >< 
>< Seal >< BsaJI 

><: RsaI >< Tru9I >< Eael Bn\el8I >< 

X Csp6I >< Msel >< CfrlOI Avail x 

X Afal >< Dral >< BshI Asul >< 

CTACCAACCT TACAGAGTTG TAGTACTTTC TTTTGAACTT TTAAATGCAC CGGCCACGGT TTGTGGACCA 
22970 22980 22990 23000 23010 23020 23030 

X Tru9I >< RsaI 

>< T ^u9I >< csp6I 

>< Plel BsrI X 

> < Tru91 >< Msel >< BsrI 

> < Mselx BsrI >< Msel x Hinfl ><■ nf aT 
AAATTATCCA CTGACCTTAT TAAGAACCAG TGTGTCAATT TTAATTTTAA TGGACTCACT GGTACTGGTG 

23040 23050 23060 23070 23080 23090 23100 

><C Tru91 x Pali 

><C MseI >< Haelll 

>< MboII >K Gdiir 

>< H *> aI X Eael 

x Sn 

TGTTAACTCC TTCTTCAAAG AGATTTCAAC CATTTCAACA ATTTGGCCGT^GATGTTTCTG ATTTCACTGA 
* 23110 23120 23130 23140 23150 23160 23170 

> < XhoII 
X TthHB8I 
X TaqI 

> < Sau3AI 

> < Ndell 

> < Mfll 

> < Mbol 

> < DpnII 

>< Dpnl 

> < BstYI 

> < BspAI > < sspl 

X Alwl X Bspl43I >< HphI 

TTCCGTTCGA GATCCTAAAA CATCTGAAAT AT TAG AC AT T TCACCTTGCT CTTTTGGGGG TGTAAGTGTA 
23180 23190 23200 23210 23220 23230 23240 

X ScrFI 
x Mval 
>< EcoRII 

x Ecll36I >< 

>< BstOI Lur 
>< BstNI x Ktt 

^ * S1 " >< Eco57I 

ApyI >< Bsgl >< Hindi 

ATTACACCTG GAACAAATGC TTCATCTGAA GTTGCTGTTC TATATCAAGA TGTTAACTGC ACTGATGTTT 
tJZSU 23260 23270 23280 23290 23300 23310 

>< Sau3AI 
>< Nlalll 
X Ndell 
X Mbol 
>< DpnII 

><: Dpnl >< HinPlI 
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>< BspWI >< Hin6I 

X BspAI > < Hhal Plel >< 

>< sfcl >< Bspl43I >< Alul> < Cfol >< BsrI 

CTACAGCAAT TCATGCAGAT CAACTCACAC CAGCTTGGCG CATATATTCT ACTGGAAACA ATGTATTCCA 

23350 23360 23370 23380 



23320 



23330 



23340 



>< Espl 
>< Ddel 
>< Celll 



>< TthHB8I 
>< TaqI 
>< Sail 
>< Rtrl 
>< Nspl 
>< NspHI 
X Nlalll 
>< Hindll 
>< Bpull02I>< Hindi 
>< Hinfl >< AluI X AccI 

GACTCAAGCA GGCTGTCTTA TAGGAGCTGA GCATGTCGAC ACTTCTTATG AGTGCGACAT TCCTATTGGA 
23390 23400 23410 23420 23430 23440 23450 

> < SnaBI 

>< Seal 
>< Rsal 
>< Rmal 
>< Maell >< Mael 

> < EcolOSI 

>< Rmal >< Cs P 61 

X Maelll > < BsaAI : 

>< Alul ■ >< Mael >< AfaI ^ 

GCTGGCATTT GTGCTAGTTA CCATACAGTT TCTTTATTAC GTAGTACTAG CCAAAAATCT ATTGTGGCTT 
23460 23470 23480 23490 23500 23510 23520 

X Muni 

ATACTATGTC TTTAGGTGCT GATAGTTCAA TTGCTTACTC TAATAACACC ATTGCTATAC CTACTAACTT 
23530 * 23540 23550 23560 23570 23580 23590 

Rsal >< 
X Mnll 

Csp6I >< 

X Sfcl AfaI ><: 

TTCAATTAGC ATTACTACAG AAGTAATGCC TGTTTCTATG GCTAAAACCT CCGTAGATTG TAATATGTAC 
23600 23610 23620 23630 23640 23650 23660 

> < Tfil 

> < Hinfl 

X Acil > < AluI 

ATCTGCGGAG ATTCTACTGA ATGTGCTAAT TTGCTTCTCC AATATGGTAG CTTTTGCACA CAACTAAATC 
23670 23680 23690 23700 23710 23720 23730 



x Vnel 

x Sdul 
x NspII 
>< HgiAI 
>< Snoix Ddel 
x Bspl286I 
x Bmyl 
>< Bbvl 
X ApaLI 

X Alw44I >< DpnII >< AlwI 

X Alw21I >< Fnu4HI >< BspAI >< Afllll 

GTGCACTCTC AGGTATTGCT GCTGAACAGG ATCGCAACAC ACGTGAAGTG TTCGCTCAAG T C AAAC AAAT 
23740 23750 23760 23770 23780 23790 23800 



X Sau3AI 

X Ndell 

X Mbol 

>< Dpnl 
X Bspl43I 



X Pmll 
X PmaCI 
>< Maell 
x Eco72I 
>< BsaAI 
X BbrPI 



FIGURE 13.55 
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>< Rsal 

>< Csp6I >< Tru9I 

>< Afal >< Sspl >< Msel >< Sspl 

GTACAAAACC CCAACTTTGA AATATTTTGG TGGTTTTAAT TTTTCACAAA TATTACCTGA CCCTCTAAAG 
23810 23820 23830 23840 23850 23860 23870 

>< Mnll 

>< Mnl1 >< Tru9I >< SfaNI >< HphI Nlalll >< 

>< Ddel >< Mnll >< Msel >< Maelll BspHI >< 

CCAACTAAGA GGTCTTTTAT TGAGGACTTG CTCTTTAATA AGGTGACACT CGCTGATGCT GGCTTCATGA 

23880 23890 23900 23910 23920 23930 23940 









, >< XhoII 










X Sau3AI 




>< Styl 




>< 


Rmal 




>< Rmal 






>< Ndell 




>< Mael 






>< Mfll 




>< EcoT14I 






>< Mbol 


>< MstI 


>< Ecol30I 




>< 


Mael 


>< HinPlI 


>< BssTlI 


>< 


Vspl 


>< DpnII 


>< Hin6I 


>< BsmI 




>< Hphl> < Dpnl 


>< Hhal 


BscCI 


>< 


Tru9I 


>< BstYI 


>< Fspl 


>< BsaJI 


>< 


Msel 


>< BspAI 


>< Fdill 


>< Blnl 


>< 


Asnl 


> < Bspl43I 


>< Cfol 


>< Avrll 


>< 


Asel 


X BglXI 


>< Avill 



23950 



23960 



23970 



23980 



23990 



24000 



24010 



>< RmalRsal >< 
>< Mnll >< Fnu4HI >< Fnu4HI Csp6l >< 

X BspWI X BbvT X Bbvl >< BspWI X MaelAfal X 

TACAGTGTTG CCACCTCTGC TCACTGATGA TATGATTGCT GCCTACACTG CTGCTCTAGT TAGTGGTACT 
24020 24030 24040 24050 24060 24070 24080 

X MboII 
>< HinPlI 
>< Hin6I 
>< Hhal 
X Haell 

X Fnu4HI x Ksp632I 
>< Cfol X Earl 
>< Fokl X BspWI X Eamll04I 
X Bbvl X Bspl43II 

GCCACTGCTG GATGGACATT TGGTGCTGGC GCTGCTCTTC AAATACCTTT TGCTATGCAA AT GG CAT ATA 
24090 24100 24110 24120 24130 24140 24150 

Tru9I x 

x Maelll MseI >K 

GGTTCAATGG CATTGGAGTT ACCCAAAATG TTCTCTATGA GAACCAAAAA CAAATCG CCA ACCAATTTAA 
24160 24170 24180 24190 24200 24210 24220 



Maell X 

><r TfiI X Fnu4HI 

>< Hinfl x Bbvl x Alul 

CAAGGCGATT AGTCAAATTC AAGAATCACT TACAACAACA TCAACTGCAT TGGGCAAGCT GCAAGACGTT 
24230 24240 24250 24260 24270 24280 24290 

>< Tru9I 
>< Msel 
- >< Hpal 

x Hindll x BsmI x Tru9I 
>< HincIIX BscCI >< Msel 



>< 

X 



x Ddel 
Tru9I x Bfrl 
Msel x Alul 
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GTTAACCAGA ATGCTCAAGC ATTAAACACA CTTGTTAAAC AACTTAGCTC TAATTTTGGT GCAATTTCAA 
24300 24310 24320 24330 24340 24350 24360 

>< Thai 
>< Spol 
>< Nrul 
>< Mvnl 

>< BstOI >< TthHB8I 

>< Bsp68I >< TaqI 

>< Bsp50I >< Mnll 



>< EcoRV 



>< Rsal 
>< Csp6I 



>< Tru9I 

>< Eco32I >< AccII >< Mnll >< Aciix Afal >< Msel 

GTGTGCTAAA TGATATCCTT TCGCGACTTG ATAAAGTCGA GGCGGAGGTA CAAATTGACA GGTTAATTAC 
24370 24380 24390 24400 24410 24420 24430 

>< Maelll >< Bbvl >< Fnu4HI Bbvl X 

AGGCAGACTT CAAAGCCTTC AAACCTATGT AACACAACAA CTAATCAGGG CTGCTGAAAT CAGGGCTTCT 
24440 24450 24460 24470 24480 24490 24500 

>< Fnu4HI >< Hindll 

>< BspWI >< Ddel >< Hindi 

GCTAATCTTG CTGCTACTAA AATGTCTGAG TGTGTTCTTG GACAATCAAA AAGAGTTGAC TTTTGTGGAA 
24510 24520 24530 24540 24550 24560 24570 

> < Nspl 

> < NspHI 

> < Nlalll 
X Maelll 

>< Nlalll >< Maell 

>< MboII >< Fokl 

>< Fnu4HI >< Bbsl BsaAI >< 

>< AcilX Bbvl >< AflHI 

AGGGCTACCA CCTTATGTCC TTCCCACAAG CAGCCCCGCA TGGTGTTGTC TTCCTACATG TCACGTATGT 
24580 24590 24600 24610 24620 24630 24640 



>< ScrFI 
>< Mval 
>< EcoRII 
>< Ecll36I 
>< BstOI 
>< BstNI 
X Mnll X BslI 
>< DsaVx BsiYI 

X BsiLI 
>< BsaJIX HphI 
X Apyl 



X HinPlI 
X Hin6I 
X Hhal 

X Haell 
X Cfol x Nlalll 

X Bspl43II >< BspHI EcoNI X 

GCCATCCCAG GAGAGGAACT TCACCACAGC GCCAGCAATT TGTCATGAAG G C AAAGC AT A CTTCCCTCGT 
24650 24660 24670 24680 24690 24700 24710 



X Mnll 
X BslI >< Tru9I 

X BsiYI X Msel >< Mnll 

GAAGGTGTTT TTGTGTTTAA TGGCACTTCT TGGTTTATTA CACAGAGGAA CTTCTTTTCT CCACAAATAA 
24720 24730 24740 24750 24760 24770 24780 

>< Ddel >< Tru9I 

X BsmAI >< SfaNI 

>< Sfcl X Alw26I >< MselAlwI X 

TTACTACAGA CAATACATTT GTCTCAGGAA ATTGTGATGT CGTTATTGGC ATCATTAACA ACACAGTTTA 
24790 24800 24810 24820 24830 24840 24850 



>< Sau3AI 
X Ndell 



FIGURE 1337 
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>< Mbol >< piel > < ScaI 

>< DpnII >< Mnll > < Ksp632I > < Rsa i 

>< Dpnl >< Ddel >< Hinfl >< Mbol I 

>< BspAI >< BspWI > < Eamll04I >< Csp6I 

>< Bspl43I >< Alul > < Earl > < Alul > < Afal > < HphI 

TGATCCTCTG CAACCTGAGC TTGACTCATT CAAAGAAGAG CTGGACAAGT ACTTCAAAAA TCATACATCA 
24860 24870 24880 24890 24900 24910 24920 

>< Sau3AI 
>< Ndell 
>< Mbol 
>< MamI 
>< DpnII 

>< Dpnl 
X BspAI 

X Bspl43I 

>< BsiBI >< Tru9I >< Hindu 

x BsaBI >< Ms ei >< Hindi Acil x 

CCAGATGTTG ATCTTGGCGA CATTTCAGGC ATTAACGCTT CTGTCGTCAA CAT T C AAAAA GAAATTGACC 
24930 24940 24950 24960 24970 24980 24990 

>< Tru9I 

> < Tfil 
X Mnll >< Swal 

X EcoNI >< Msei 

>< BslI > < HinfI 

>< Mnlix BsiYI >< Dral 

GCCTCAATGA GGTCGCTAAA AATTTAAATG AATCACTCAT TGACCTTCAA GAATTGGGAA AATATGAGCA 
25000 25010 25020 25030 25040 25050 25060 

x Styl 
X Pall 
>< Haelll 

>< EcoT14I 

>< Ecol30I 
>< BsuRI 

x BssTlI Nlalll X 

X Tru9lX BshI ' : T C 

XMsel XBsaJI X B^tXI 

ATATATTAAA TGGCCTTGGT ATGTTTGGCT CGGCTTCATT GCTGGACTAA TTGCCATCGT CATGGTTACA 
25070 25080 25090 25100 25110 25120 25130 

> < SphI 

> < Pael 

X Spel > < NspI 

> < Rmal > < N S pHi 
X Nlalll > < NlaIII 

> < Mael >< MnllX Bbvl Fnu4HT ><r 
ATCTTGCTTT GTTGCATGAC TAGTTGTTGC AGTTGCCTCA AGGGTGCATG CTCTTGTGGT TCTTGCTGCA 

25140 25150 25160 25170 25180 25190 25200 

>< Fokl 
>< Ddel 

X Mnll x PlelX Hinfl >< BsrI 

AGTTTGATGA GGATGACTCT GAGCCAGTTC TCAAGGGTGT CAAATTACAT TACACATAAA CGAACTTATG 
25210 25220 25230 25240 25250 25260 25270 

x Sau3AI 
X Ndell 
X Mbol 
X DpnII 
> < Dpnl 

PTOiror: n k o 
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>< BspAI 

> < Bspl43I 

>< Bsgl >< Alwl >< BsrI BspWI > 

GATTTGTTTA TGAGATTTTT TACTCTTGGA TCAATTACTG CACAGCCAGT AAAAATTGAC AATGCTTCTC 
25280 25290 25300 25310 25320 25330 25340 



>< Seal 
>< Rsal 
>< Csp6I >< Sfcl 

>< Afal >< Nlalll >< Acil >< Mnll Fokl > 

CTGCAAGTAC TGTTCATGCT ACAGCAACGA TACCGCTACA AGCCTCACTC CCTTTCGGAT GGCTTGTTAT 
25350 25360 25370 25380 25390 25400 25410 



> < HinPlI 

> < Hin6I 

X Hhal 

>< Haell >< HinPlI 

>< Eco47III >< Hin6I 

X Cfol >< Hhal 

X BspWI X Bspl4 3II X Cfol 
TGGCGTTGCA TTTCTTGCTG TTTTTCAGAG CGCTACCAAA ATAATTGCGC TCAATAAAAG ATGGCAGCTA 

25420 25430 25440 25450 25460 25470 25480 



Rmal >< 
Nhel X 

Mael >< 
Fnu4HI X 

Alul >< 



>< EcoNI 
>< Bsll 

>< BsiYI >< Maelll 

X Bbvl >< BsrI >< Bbvl > < Fnu4HI Bbvl >< 

GCCCTTTATA AGGGCTTCCA GTTCATTTGC AATTTACTGC TGCTATTTGT TACCATCTAT TCACATCTTT; 
25490 25500 25510 25520 25530 25540 25550- 



Zsp2I X 
PpulOI X 

Nsil >< 

>< Rsal Mphll03I x- 

>< Csp6I ECOT22I X 

X Afal >< Mnll Avalll >< 

TGCTTGTCGC TGCAGGTATG GAGGCGCAAT TTTTGTACCT CTATGCCTTG ATATATTTTC TACAATGCAT 
25560 25570 25580 25590 25600 25610 25620 



> < Sfcl 
>< PstI 

> < Fnu4HI 
X BspMI >< Mnll 



>< HinPlI 
X Hin6I 
>< Hhal 
X Cfol 



>< SfaNI 
>< Nspl 
>< NspHI 

X Nlalll >< Sfa ** 

CAACGCATGT AG7VATTATTA TGAGATGTTG GCTTTGTTGG AAGTGCAAAT CCAAGAACCC AT TACT T TAT 
25630 25640 25650 25660 25670 25680 25690 

X Bstll07I 
X AccI Mael I I X 

GATGCCAACT ACTTTGTTTG CTGGCACACA CATAACTATG ACT AC T GTAT ACCATATAAC AGTGTCACAG 
25700 25710 25720 25730 25740 25750 25760 

X MboII 

X HphI BstXI X 

X Muni >< Maelll X Maelll X Eco57I >< Bbsl Mnll > 

ATACAATTGT CGTTACTGAA GGTGACGGCA TTTCAACACC AAAACTCAAA GAAGACTACC AAATTGGTGG 
25770 25780 25790 25800 25810 25820 25830 

>< Rsal 

> < Nlalll 
X HphI 
X Tru9I >< Tthlllix Csp6I 
>< Ddel x Ddel X MselX Aspl >< Afal 

FIGURE 13.59 
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TTATTCTGAG GATAGGCACT CAGGTGTTAA AGACTATGTC GTTGTACATG GCTATTTCAC CGAAGTTTAC 
25840 25850 25860 25870 25880 25890 25900 

Tru9I >< 

> < HinfIX Plel >< BsrI Msel >< 

>< Alul >< AccI >< Sfcl >< AlwNI >< MboII Hindi II > 

TACCAGCTTG AGTCTACACA AATTACTACA GACACTGGTA TTGAAAATGC TACATTCTTC ATCTTTAACA 
25910 25920 25930 25940 25950 25960 ' 25970 

> < TthHB8I 

>< Tru9l > < TaqI >< Ksp632I 

>< Msel > < MboII >< Earl BspWI >< 

>< Alul >< Eco57I >< Eamll04I Alwl X 

AGCTTGTTAA AGACCCACCG AATGTGCAAA TACACACAAT CGACGGCTCT TCAGGAGTTG CTAATCCAGC 
25980 25990 26000 26010 26020 26030 26040 

>< XhoII 
X Sau3AI 

>< NlalV 
x Ndell 
X Mfll 
X Mbol 
>< DpnII 

>< Dpnl 
X BstYI 
>< BstI 
X BspAI 

X Bspl43l RsaI 
x BscBI >< Rmal Csp6I x 

>< BamHI x Alwl >< Mael Afal x 

AATGGATCCA ATTTATGATG AGCCGACGAC GACTACTAGC GTGCCTTTGT AAGCACAAGA AAGTGAGTAC 
26050 26060 26070 26080 26090 26100 26110 

> < Tru9I 
>< RsaI 

> < Msel 
>< MboII 

> < RsaI >< Maell x RsaI 
X Csp6I >< Csp6I X Tru9I x Csp6l 

> < Afal >< Afal >< Msel >< Afal 
GAACTTATGT ACTCATTCGT TTCGGAAGAA ACAGGTACGT TAATAGTTAA TAGCGTACTT CTTTTTCTTG 

26120 26130 26140 26150 26160 26170 26180 

X TthHB8I 
X TaqI 

X Rmal >< HinPlI > < R sa i 

> < Maelll x Hin6I Fnu4HI X 

>< Mael x Rmal x Hhal >< Csp6I 

X Fokl X Mael x Cfol x Bbvl > < Afal 

CTTTCGTGGT ATTCTTGCTA GTCACACTAG CCATCCTTAC TGCGCTTCGA TTGTGTGCGT ACTGCTGCAA 
26190 26200 26210 26220 26230 26240 26250 

>< Tru9I 

X Tru9I >< ThaI 

>< Msel >< MvnI 

>< Sspl x Maell >< MseI 

>< H P aI X BstUI Ksp632I > 

X HmdII >< Maell X Bsp50I x MboII Earl > 

x Hindi >< AccI X AccII Eamll04I > 

TATTGTTAAC GTGAGTTTAG TAAAACCAAC GGTTTACGTC TACTCGCGTG TTAAAAATCT GAACTCTTCT 
26260 26270 26280 26290 26300 26310 26320 



T?t/-^t 7T% tt» -i r\ 
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>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 

X MboIIX Dpnl Tru9I 
X Xmnl >< BspAI> < Eco57I >< 

GAAGGAGTTC^ CTGATCTTCT^ GGTCTAAACG AACTAACTAT TATTATTATT CTGTTTGGAA CTTTAACATT 
26330 26340 26350 26360 26370 26380 ZbJyu 

>< ScrFI 
>< Mval 

>< EcoRII 
>< EC1136I 

X DsaV NlalV >< 

>< Rsal >< Bst01 

>< Mnll >< Tru9I >< BstNI Rmal >< 

>< Csp6I >< MseI BsiLI MaeI ><: 

> < Nlalll >< Afal > < Alul >< ApylBscBI >< 

GCTTATCATG GCAGACAACG GT ACT AT T AC CGTTGAGGAG CT T AAACAAC TCCTGGAACA ATGGAACCTA 
26400 26410 26420 26430 26440 26450 26460 

>< ScrFI 
>< Rmal 

X Mval 
>< MaeI 

>< EcoRII 

X Ecll36I 
X DsaV 

>< Bstoi ;i 

X BstNI V 
X BsiLI 

x Apyl >< MaeI 1 1 

GTAATAGGTT TCCTATTCCT AGCCTGGATT ATGTTACTAC AATTTGCCTA TTCTAATCGG AACAGGTTTT ; 
26470 26480 26490 26500 26510 26520 

X Pall 
X MscI 
>< Mnll >< Maelll 
x Haelll 
X Eael 
X BsuRI 
X BsrI 

x Rsal >< Bs P WI ^ 

X Csp6I X HindHI • >< BshI 

X Afal >< Alul >< Ball >< Bbvl Fnu4HI >< 

TGTACATAAT AAAGCTTGTT TTCCTCTGGC TCTTGTGGCC AGTAACACTT GCTTGTTTTG TGCTTGCTGC 
26540 26550 26560 . 26570 26580 26590 26600 

x vspl 
x Tru9I 

X MseI >< H P hI 

X Sfcl >< Asnl >< BsrI 

^><: Arcl x AselX MaelllX Acil 
TGTCTACAGA ATTAATTGGG TGACTGGCGG GATTGCGATT GCAATGGCTT GTATTGTAGG CTTGATGTGG 
26610 26620 26630 26640 26650 26660 26670 

>< Espl 

X Eco57I 

>< Ddel ^ . 

>< Celll >K n It 

x Bpull02I >< Cs P 61 

FIGURE 13.61 
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>< Bfr * >< Afal 

>< AluI >< Acil Mboll > 

CTTAGCTACT TCGTTGCTTC CTTCAGGCTG TTTGCTCGTA CCCGCTCAAT GTGGTCATTC AACCCAGAAA 
26680 26690 26700 26710 26720 26730 26740 

>< ScrFI 

>< Neil 
>< Mspl 
>< Hpall 
>< HapII 
>< DsaVX Mnll 

>< BslI 

>< BsiYI 

>< BsaJI >< Muni > < Xcml 

>< Bcnl >< Maelll >< Acil >< Nlalll 

CAAACATTCT TCTCAATGTG CCTCTCCGGG GGACAATTGT GACCAGACCG CTCATGGAAA GTGAACTTGT 
26750 26760 26770 26780 26790 26800 26810 



>< Sau3AI 
>< Ndell 
>< Mbol 

>< Fbal 
>< DpnII 

>< Dpnl 
>< BspAI 

>< Bspl43I 
>< BsiQI 
>< BcLI 



>< Pall 
>< Mspl 
>< Hpall 
>< HapII 
>< Haelll 
X Gdill 
>< Eael 
>< BsuRI 



Tru9I >< 
SinI 
Sau96I 
PpuMI 
NspIV 
Msel >< 
>< Maelll 

> < Rmal >< Haell 

> < Mael EcoO109I 

>< HinPlIEco47I 
>< Styix Hin6I Drall 
X EcoT14I Cfrl3I 
X Ecol30Ix Bspl43II 
>< BssTlI BsiZI 
X BsaJI Bmel8I 
X Blnl x Hhal Avail 
X Avrll x Cfol Asul 



> 
> 
> 
> 



> 
> 
> 
> 

> 
> 
> 
> 



X Maelll >< BshI ^ ftViIi ^ , ro , « lo „ , > 

CATTGGTGCT GTGATCATTC GTGGTCACTT GCGAATGGCC GGACACTCCC TAGGGCGCTG T GACATTAAG 
26820 26830 26840 26850 26860 26870 26880 

>< Sau3AI 
X Ndell 
X Mbol 
>< DpnII 
>< Dpnl 
X PssI X BspMI 

>< BspAI >< xmnl 

>< Bspl43l >< Asp700I > < Hqal Fnu4HI x 

GACCTGCCAA AAGAGATCAC TGTGGCTACA TCACGAACGC TTTCTTATTA CAAATTAGGA GCGTCGCAGC 
26890 26900 26910 26920 26930 26940 26950 



>< PspSII 
X NspHII 



>< Tfil 
X Hinf I 

>K BbvI > < Tru9l 

BbvI >< Fnu4HI X Acil > < M<5eT 

GTGTAGGCAC TGATTCAGGT TTTGCTGCAT ACAACCGCTA CCGTATTGGA AACTATAAAT TAAATACAGA 
26960 26970 26980 26990 27000 27010 27020 



>< Mspl 
x Hpall- 
X HapII 
X CfrlOI 
>< Bcgl/a 



X Sspl 



x Rsal 
>< Rmal 

x Csp6I 
>< Maelx Bcgl 

X Afal X Maelll 



Hindu x 
Hindi >< 
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CCACGCCGGT AGCAACGACA ATATTGCTTT GCTAGTACAG TAAGTGACAA CAGATGTTTC ATCTTGTTGA 
27030 27040 27050 27060 27070 27080 27090 

>< ScrFI 

>< Mval 

>< Maelll 
>< EcoRII 

>< Ecll36I 
>< DsaV 

>< BstOI 

>K I st " 1 - X Tfil 

X AdvI >< Mnl1 HinfI 

CTTCCAGGTT ACAATAGCAG AGATATTGAT TATCATTATG AGGACTTTCA GGATTGCTAT TTGGAATCTT 
27100 27110 27120 27130 27140 27150 27160 

X BsmAI >< Tru9I > < Mnl I 

>< Maell >< Alw26I >< Msel >< Ddel >< MboII 

GACGTTATAA TAAGTTCAAT AGTGAGACAA TTATTTAAGC CTCTAACTAA GAAGAATTAT TCGGAGTTAG 
27170 27180 27190 27200 27210 27220 27230 

X Ksp632I 
>< MboII >< Earl 

>< MboII >< NlaIIIEarall04I >< 

ATGATGAAGA ACCTATGGAG TTAGATTATC CATAAAACGA ACATGAAAAT TATTCTCTTC CTGACATTGA 
27240 27250 27260 27270 27280 27290 27300 

> < Rsal >< Rsal 
>< Csp6I >< Csp6I 
> < Alul >< Mnll > < Afal >< Afal 

TTGTATTTAC ATCTTGCGAG CTATATCACT ATCAGGAGTG TGTTAGAGGT ACGACTGTAC TACTAAAAGA 
27310 27320 27330 27340 27350 27360 27370 

X Mnll >< HphI X HphI >< Mnll 

ACCTTGCCCA TCAGGAACAT ACGAGGGCAA TTCACCATTT CACCCTCTTG CTGACAATAA ATTTGCACTA 
27380 27390 27400 27410 27420 27430 27440 

Sau3AI > 

> < PvuII 

> < PspSI 

> < NspBII 
X TthHB8I Ndell > 
X TaqI Mbol > 

x Rsal >< Fnu4HI 

X Csp6I DpnII > 

X Rmal >< BbvI ^ n f S ? AI > 

X Mael >K AfaI > < AluI 

ACTTGCACTA GCACACACTT TGCTTTTGCT TGTGCTGACG GTACTCGACA TACCTATCAG CTGCGTGCAA 

27450 27460 27470 27480 27490 27500 27510 

X SstI 
X Sdul 
X SacI 
X NspII 
>< HgiAI 
X Eco24I 
> < Ecll36II 

X BspWI 
X Bspl286I 
X Bmyl 
>< Banll 

FIGURE 13. 63 
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>< Bspl4 3I >< Mn n > < A± 

GATCAGTTTC ACCAAAACTT TTCATCAGAC AAGAGGAGGT TCAACAAGAG CTCTACTCGC CACTTTTTCT 
27520 27530 27540 27550 27560 27570 27580 

SstI >< 
Sdul >< 
Sad >< 
NspII >< 
HgiAI >< 
Eco24I >< 
Ecll36ll >< 
Bspl286I >< 

X Rmal >< Tru9l Banll x 

>< Mael >< Msel >< Tru9I Alw21l x 

>< Fnu4HI >< HphI >< MseI !i t L 

CATTGTTGCT GCTCTAGTAT TTTTAATACT TTGCTTCACC ATTAAGAGAA AGACAGAATG A^GAGCTCA 
^ 0yU 27600 27610 27620 27630 27640 27650 

>< Tru9I _ m ^ 

>< Msel l< I™ 9 / 

CTTTAATTGA CTTCTATTTG TGCTTTTTAG CCTTTCTGCT ATTCCTTGTT TTAATAATGC TTATTATATT 

27660 27670 27680 27690 27700 27710 27720 

>< XhoII 
>< Xbal 

> < ScrFI 

>< Sau3AI 

>< Rmal 
>< Ndell 

> < Mval 

>< Mfll 
>< Mbol 
>< EcoRUX Mael 

> < Ecll36I 

>< DpnII 

X Dpnl 
>< BstYI 

> < BstOI 

> < BstNI 

>< TthHB8I X BspAI > < RsaI 

X DsaVX Bspl43I >< MboII 

> < BsiLI x Csp6I 

><C TaqI > < A Py T > < AlwI > < Afal w muttt 

TTGGTTTTCA CTCGAAATCC AG GATCTAGA AGAACCTTGT ACCAAAGTCT AAACGAACAT SaSJSc 
27730 27740 27750 27760 27770 27780 27790 

X HinPlI 
x Hin6I 
X Hhal 
>< RsaI x Haell 
>< Sfcl x Eco4 7IIl 

X Csp6I>< Cfol SfaNI X 

ATTGTTTTGA TC „ «^ ~^^ C l^ 

>< XhoII 
>< Sau3AI 
>< Ndell 
> < Mnll 

>< Mfll 
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>< Mbol 
>< DpnII 

>< Dpnl >< Rsal 

>< BstYI >< MboII 
>< NlalllX BspAI >< Csp6I >< Rmal 

>< Alwl >< Bspl4 3I >< Afal >< Mael 
CTCATGTGCT TGAAGATCCT TGTAAGGTAC AACACTAGGG GTAATACTTA TAGCACTGCT TGGCTTTGTG 
27870 27880 27890 27900 27910 27920 27930 



>< Sdul 

>< Rmal 
>< NspII 

>< Mael 

>< HgiAI m ^ 

X Bspl286I >< Ns P I 

RmvT >< NspHI 

><Alw21I xNlalll >< Maelll 

CTCTAGGAAA GGTTTTACCT TTTCATAGAT GGCACACTAT GGTTCAAACA TGCACACCTA ATGTTACTAT 
27940 27950 27960 27970 27980 27990 28000 



CAACTGTCAA GATCCAGCTG GTGGTGCGCT TATAGCTAGG TGTTGGTACC TTCATGAAGG TCACCAAACT 



> < XhoII 

> < Sau3AI > < Van 91 I 

>< PvuII 
>< Psp5I 

> < Ndell > < PflMI 

> < MfllX NspBII 

> < DpnII >< HinPlI 

X Bspl43I X Hin6I 

> < BstYI > < BslI X Hhal 

> < BspAI > < BsiYIX Cfol 

> < MbolX AluIX BspWI 
Alwl X Dpnl > < AccB7I 



X Kmal 
X Mael 
X BspWI 
>< Alul 



>< Rsal 

>< NlalV 
>< Kpnl 
X Eco64I 
X Csp6IX HphI 

X BscBI >< 
>< BanI >< BspHI 
X Asp718 >< 

x Afal >< 
X AccBlI >< 



>< Nlalll 

X Maelll 



Eco0651 



Eco91I 

BstPI 

BstEII 



X Acc65I 



x Bbvl 



28010 



28020 



28030 



28040 



28050 



28060 



28070, 



X Fnu4HI 
X Esp3I 
>< BsmAI 
X Alw2 6I 



>< Rsal 
>< Mael I 
>< Csp6I 
>< BsmBI 
x Afal 



>< Tru9I 
>< Msel 
>< Dral 



X Trii9I 
x Msel 



X SinI 
X Sau96I 
>< NspIV 
NspHII X 

NlalV x 

X Eco47I 
>< Cfrl3I 
>< BsiZI 

BscBI X 

>< Bmel8I 
X Avail 
>< Asul 



GCTGCATTTA GAGACGTACT TGTTGTTTTA AATAAACGAA CAAATTAAAA TGTCTGATAA TGGACCCCAA 



28080 



28090 



28100 



28110 



28120 



28130 



28140 



>< Maell 



X Sdul 
X NspII 
X Bspl286I 
X Bmyl 

X Acil 



>< SinI 
>< Sau96l 
X NspIV 
>< NspHII 
>< NlalV 
X Eco47I 
X Cfrl3I 
>< BsiZI 

>< BscBI 
>< Bmel8I 
>< Avail X Tfil 
X Asul X Hinfl 



X Mnll 



FIGURE 13. 65 
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TCAAACCAAC GTAGTGCCCC CCGCATTACA TTTGGTGGAC CCACAGATTC AACTGACAAT AACCAGAATG 
28150 28160 28170 28180 28190 28200 28210 

X HinPlI >< Styl 
>< Haell 

> < Pall X Hin6I >< EcoT14I 

> < Haelll X HhalX Ecol30I 

X BspWI X BssTlI 

> < BsuRI X BsplOII 

>< Hgal> < BshI X Cfoix BsaJI X Hgal 

GAGGACGCAA TGGGGCAAGG CCAAAACAGC GCCGACCCCA AGGTTTACCC AATAATACTG CGTCTTGGTT 
28220 28230 28240 28250 28260 28270 28280 

X TthHB8I 

> < ScrFI 
>< Pall 

X PaeR7I 
x NspIII 

> < Mval 
>< Haelll. 
x EcoRII 

X Eco8 8I 

x Xhol > < Ecll36I 
X DsaV 
X BsuRI 
X Slal > < BstOI 
X MnllX Taql> < BstNI 
>< Ccrl > < BsiLI 
>< Hinfl x BshI 

X TfilX Bcoix BsaJI 
X Mnll X Ddel X Aval > < Apyl 

>< Alul x Ddel > < Nlalll x Bfrl >< Ama87I >< Mnll 
CACAGCTCTC ACTCAGCATG GCAAG GAGGA ACTTAGATTC CCTCGAGGCC AGGGCGTTCC AATCAACACC 
28290 28300 28310 28320 28.330 28340 28350 

>< SinI 
X Sau96I 
X NspIV 

X NspHII 
>< Eco47I 
x Cfrl3I 
X BsiZI 

X Bmel8l > < Ksp632I 

>< Avail > < Eamll04I 

X Asul > < Earl > < AluIX MboII X Maelll 

AATAGTGGTC CAGATGACCA AATTGGCTAC TACCGAAGAG CTACCCGACG AGTTCGTGGT GGTGACGGCA 
28360 28370 28380 28390 28400 28410 28420 



>< SstI 
>< Sdul 
x SacI 
X NspII 
X HgiAI 

X Espl 
x Eco24I 
X Ecll36II 

x Ddel 

>< Celll 
>< Bspl286I 

x Bpull02I 
X Bmyl 
x Banll 



X Rsal 



X Styl 
>< Rmal 
>< Mael 
x EcoTl4I 
x Ecol30I 
X BssTlI 
X BsaJI 



x Sau96l 
X Pall 

X NspIV 
>< Haelll 

>< Cfrl3I 
>< BsuRI 
> < BsrI 

>< BsiZI 
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>< Alw21I >< Csp6I >< Blnl >< Bshix Hindlll 

>< HphI >< Alul >< Afal >< Avrll >< Asul X Alul 

AAATGAAAGA GCTCAGCCCC AGATGGTACT TCTATTACCT AGGAACTGGC CCAGAAGCTT CACTTCCCTA 
28430 28440 28450 28460 28470 28480 28490 

X HinPlI 
>< Hin6I . 
>< Hhal 
X Haell 

>< cf ol > < Mnll >< NlalV 

>< Bspl43II >< SfaNI >< Ddel X BscBI 

CGGCGCTAAC AAAGAAGGCA TCGTATGGGT TGCAACTGAG GGAGCCTTGA ATACACCCAA AGACCACATT 
28500 28510 28520 28530 28540 28550 28560 

>< NlalV 
X Eco64I 

>< BscBI 
>< BanI 

>< Acil 

>< AccBlI X Bbvl >< Fnu4HI >< Mnll 

GGCACCCGCA ATCCTAATAA CAATGCTGCC ACCGTGCTAC AACTTCCTCA AGGAACAACA TTGCCAAAAG 
28570 28580 28590 28600 28610 28620 28630 

>< Thai 
>< Mnll 
>< Maell >< Mvnl 
X Mnll BstUI X 

X Fnu4HI >< Ksp632I BspSOI X 

>< BspWI >< EarX >< BsaAIX Acil 

>< Mnll >< Mnll X AcilX MboII >< Eamll04I AccII X 

GCTTCTACGC AGAGGGAAGC AGAGGCGGCA GTCAAGCCTC TTCTCGCTCC TCATCACGTA GTCGCGGTAA 
28640 28650 28660 28670 28680 28690 28700 

>< ScrFI 
X Mval 

X EcoRII >< TthHB8I 

>< Ecll36I >< Km* 1 

X DsaVX Fnu4HI >< NheI 

X BstOI >< Mnl1 

x BstNI >< MaeI 

X BsiLI > < BspWI 

X Apyl >< Bbvl >< TaqI >< Acil 

TTCAAGAAAT TCAACTCCTG GCAGCAGTAG GGGAAATTCT CCTGCTCGAA TGGCTAGCGG AGGTGGTGAA 

28710 28720 28730 28740 28750 28760 28770 

> < Thai 

> < Mvnl 

X HphI >< Mnll 

> < HinPlI 

> < Hin6I 

X Hhal 

> < BstUI X Rmal Pal1 >K 

> < Bsp50l x MaeI Haelll X 
X Bbvl X CfolX Fnu4HI BsuRI X 

> < AccIlX BspWI >< Alul BshI X 
ACTGCCCTCG CGCTATTGCT GCTAGACAGA TTGAACCAGC TTGAGAGCAA AGTTTCTGGT AAAGGCCAAC 

28780 28790 28800 28810 28820 28830 28840 

Rsal X 

> < Pallx Maelll ><: Mnl1 

> < Haelll >< Fnu4HI Maell >< 

> < BsuRI >< Ddel >< Ddel Csp6I X 



FIGURE 13,67 
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> < BshI > < Bbvl >< Mnll >< BspWI >< SfaNI Afal X 

AACAACAAGG CCAAACTGTC ACTAAGAAAT CTGCTGCTGA GGCATCTAAA AAGCCTCGCC AAAAACGTAC 



28850 



28860 



28870 



28880 



28890 



28900 



28910 



>< Rsal 

>< Maelll 

X Maell >< Esp3I 

>< Csp6I X BsmAI 

>< Afal >< Alw26I> < 

TGCCACAAAA CAGTACAACG TCACTCAAGC ATTTGGGAGA CGTGGTCCAG AACAAACCCA AGGAAAT TT C 
28920 28930 28940 28950 28960 28970 28980 



X Tthllll 
X SinI 
>< Sau96I 
>< NspIV 
>< NspHII 
> < Maell 

X Eco47I 
>< Cfrl3I 
X BsmBI 
>< BsiZI 
>< Bmel8I 
>< Avail 
>< Asul 
Aspl 



X Styl 
X EcoT14X 
>< Ecol30I 
X BssTlI 
>< BsaJI 



X SinI 
x Sau96I 
>< NspIV 
X NspHII 
X NlalV 
X Eco4 7I 
X Cfrl3I 
X BsiZI 

X BscBI 
x Bmel8I 
x Avail 
X Asul 



X Pall 
X Haelll 
x Gdill 

>< Fnu4HI 
x Eael 
X BsuRI 
X BshI 
X Acil 



X 



BspWI 
BspWI 



GGGGACCAAG ACC TAATCAG ACAAGGAACT GATTACAAAC ATTGGCCGCA AATTGCACAA TTTGCTCCAA 
28990 29000 29010 29020 29030 29040 29050 



>< BsmI >< Nlalll 

x BscCI X Mnll x Maelll X Maelll X Nlalll 

GTGCCTCTGC ATTCTTTGGA ATGTCACGCA TTGGCATGGA AGTCACACCT TCGGGAACAT GGCTGACTTA 



29060 



29070 



29080 



29090 



29100 



29110 



29120 



x Tru9I 
X NlalV 
X Nlalll 

X Msel 
>< BscBI X BstXlX 



x XhoII 
>< Sau3AI 
>< Ndell 
X Mfll 
x Mbol 

X Fokl 
X DpnII 

> < Dpnl 
X BstYI 
X BspAI 
Alwl> < Bspl43I 



X Tthllll 
X Maell 
>< Aspl 



BspWI X 



TCATGGAGCC ATTAAATTGG ATGACAAAGA TCCACAATTC AAAGACAACG TCATACTGCT GAACAAGCAC 
29130 29140 29150 29160 29170 29180 29190 



Espl X 
Ddel X 
Celll X 
Bpull02I >< 

>< Hgal Alul >< 

ATTGACGCAT ACAAAACATT CCCACCAACA GAGCCTAAAA AGGACAAAAA GAAAAAGACT GATGAAGCTC 
29200 29210 29220 29230 29240 29250 29260 
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>< Plel 

w PnndHT >< MboII 

>< BSPWI X MboII >< Ksp632I >< Gsul 

I* bsSt >< Maelll >< EarlX Fnu4HI 

l< Alw26T >< Hinfl >< Eamll04I>< Bpml 

>< Acil >< Fnu4HI >< Bbvl >< Acil >< Nlalll 

AGCCTTTGCC GCAGAGACAA AAGAAGCAGC CCACTGTGAC TCTTCTTCCT GCGGCTGACA TGGATGATTT 
29270 29280 29290 29300 29310 29320 

X Nlalll >< Hinfl Nlalll >< 

x Fr>lfT x Alul >< Tfiix Ddel >< BspHI 

CTCCAGACAA CTTCAAAATT CCATGAGTGG AGCTTCTGCT GATTCAACTC AGGCATAAAC ACTCATGATG 
29340 29350 29360 29370 29380 29390 tv<wv 

>< Maell >< AccI 

ACCACACAAG GCAGATGGGC TATGTAAACG TTTTCGCAAT TCCGTTTACG ATACATAGTC TACTCTTGTG 
29410 29420 29430 29440 29450 29460 29470 

>< Tru9I 
>< Tru91 

>< Msel 
>< Msel 

X EcoRIX Maelll >< KSlI Tru9I >< 

>< Asd700I >< Bsgl >< Hindi Msel >< 

CAGAATGAAT TCTCGTAACT AAACAGCACA AGTAGGTTTA GTTAACTTTA AT C T C AC AT A GCAATCTTTA 
29480 29490 29500 29510 29520 29530 29540 

Xorll > 
TthHB8I > 
TaqI > 
Sau3AI >< 
Rsal >< % 
X ThalPvuI > 
Ndell >< 
>< Mnll 
>< MvnIMcrl > 
Mbol X 
DpnII >< 
Dpnl >< 
Csp6I >< 
>< BstUI 
>< Haelll BspCI > 
BspAI >< 
X TthHB8I >< Bsp50I 

>< Pall Bspl43I >< 
>< BsuRI BsiEI > 
X BshlAfal >< 

X Mnll >< Ta ^ ><: * ci * 

MaeTTT >< Mnl1 ><: AccI1 

ATCAATGTGT AACATTAGGG AGGACTTGAA AGAGCCACCA CATTTTCATC ^GGCCACGC GGAGTACGAT 
29550 29560 29570 29580 29590 29600 29610 

>< Sdul 
>< NspII 

X MboII >< Vspl 

>< Ksp632I X Eco24I X Tru9I 

X Rsal X Rmal >< Fnu4HI >< Bs P 128 6I X Msel 

X Csp6I X Mael >< Earl >< Bmyl x Asnl 

X Afal >< Bbvl > < AluIX Eamll04I X Banll X Asel 
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CGAGGGTACA GTGAATAATG CTAGGGAGAG CTGCCTATAT GGAAGAGCCC TAATGTGTAA AATTAATTTT 
29620 29630 29640 29650 29660 29670 29680 

>< Tru9I >< Ddel 
>< Msel >< Bfrl 
>< Nlalll > < Alul 
AGTAGTGCTA TCCCCATGTG ATTTTAATAG CTTCTTAGGA GAATGACAAA AAAAAAAAAA AAAAAA 
29690 29700 29710 29720 29730 29740 
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S226CAS111.ST25 
SEQUENCE LISTING 

<110> INSTITUT PASTEUR 
CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE 

<120> utilisation des proteines et des peptides codes par le genome d f une 
nouvelle souche de coronavirus associe au SRAS 

<130> F226CAS111 

<160> 75 

<170> Patent in version 3.1 

<210> 1 

<211> 29746 

<212> DNA 

<213> CORONAVIRUS 



<400> 1 
atattaggtt 


tttacctacc 


caggaaaagc 


caaccaacct 


cgatctcttg 


tagatctgtt 


60 


ctctaaacga 


actttaaaat 


ctgtgtagct 


gtcgctcggc 


tgcatgccta 


gtgcacctac 


120 


gcagtataaa 


caataataaa 


ttttactgtc 


gttgacaaga 


aacgagtaac 


tcgtccctct 


180 


tctgcagact 


gcttacggtt 


tcgtccgtgt 


tgcagtcgat 


catcagcata 


cctaggtttc 


240 


gtccgggtgt 


gaccgaaagg 


taagatggag 


agccttgttc 


ttggtgtcaa 


cgagaaaaca 


300 


cacgtccaac 


tcagtttgcc 


tgtccttcag 


gttagagacg 


tgctagtgcg 


tggcttcggg 


360 


gactctgtgg 


aagaggccct 


atcggaggca 


cgtgaacacc 


tcaaaaatgg 


cacttgtggt 


420 


ctagtagagc 


tggaaaaagg 


cgtactgccc 


cagcttgaac 


agccctatgt 


gttcattaaa 


480 


cgttctgatg 


ccttaagcac 


caatcacggc 


cacaaggtcg 


ttgagctggt 


tgcagaaatg 


540 


gacggcattc 


agtacggtcg 


tagcggtata 


acactgggag 


tactcgtgcc 


acatgtgggc 


600 


gaaaccccaa 


ttgcataccg 


caatgttctt 


cttcgtaaga 


acggtaataa 


gggagccggt 


660 


ggtcatagct 


atggcatcga 


tctaaagtct 


tatgacttag 


gtgacgagct 


tggcactgat 


720 


cccattgaag 


attatgaaca 


aaactggaac 


actaagcatg 


gcagtggtgc 


actccgtgaa 


780 


ctcactcgtg 


agctcaatgg 


aggtgcagtc 


actcgctatg 


tcgacaacaa 


tttctgtggc 


840 


ccagatgggt 


accctcttga 


ttgcatcaaa 


gattttctcg 


cacgcgcggg 


caagtcaatg 


900 


tgcactcttt 


ccgaacaact 


tgattacatc 


gagtcgaaga 


gaggtgtcta 


ctgctgccgt 


960 


gaccatgagc 


atgaaattgc 


ctggttcact 


gagcgctctg 


ataagagcta 


cgagcaccag 


1020 


acacccttcg 


aaattaagag 


tgccaagaaa 


tttgacactt 


tcaaagggga 


atgcccaaag 


1080 


tttgtgtttc 


ctcttaactc 


aaaagtcaaa 


gtcattcaac 


cacgtgttga 


aaagaaaaag 


1140 


actgagggtt 


tcatggggcg 


tatacgctct 


gtgtaccctg 


ttgcatctcc 


acaggagtgt 


1200 


aacaatatgc 


acttgtctac 


cttgatgaaa 


tgtaatcatt 


gcgatgaagt 


ttcatggcag 


1260 


acgtgcgact 


ttctgaaagc 


cacttgtgaa 


cattgtggca 


ctgaaaattt 


agttattgaa 


1320 


ggacctacta 


catgtgggta 


cctacctact 


aatgctgtag 
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tgaaaatgcc 


atgtcctgcc 


1380 
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tgtcaagacc cagagattgg acctgagcat agtgttgcag attatcacaa ccactcaaac 1440 

attgaaactc gactccgcaa gggaggtagg actagatgtt ttggaggctg tgtgtttgcc 1500 

tatgttggct gctataataa gcgtgcctac tgggttcctc gtgctagtgc tgatattggc 1560 

tcaggccata ctggcattac tggtgacaat gtggagacct tgaatgagga tctccttgag 1620 

atactgagtc gtgaacgtgt taacattaac attgttggcg attttcattt gaatgaagag 1680 

gttgccatca ttttggcatc tttctctgct tctacaagtg cctttattga cactataaag 1740 

agtcttgatt acaagtcttt caaaaccatt gttgagtcct gcggtaacta taaagttacc 1800 

aagggaaagc ccgtaaaagg tgcttggaac attggacaac agagatcagt tttaacacca 1860 

ctgtgtggtt ttccctcaca ggctgctggt gttatcagat caatttttgc gcgcacactt 1920 

gatgcagcaa accactcaat tcctgatttg caaagagcag ctgtcaccat acttgatggt 1980 

atttctgaac agtcattacg tcttgtcgac gccatggttt atacttcaga cctgctcacc 2040 

aacagtgtca ttattatggc atatgtaact ggtggtcttg tacaacagac ttctcagtgg 2100 

ttgtctaatc ttttgggcac tactgttgaa aaactcaggc ctatctttga atggattgag 2160 

gcgaaactta gtgcaggagt tgaatttctc aaggatgctt gggagattct caaatttctc 2220 

attacaggtg tttttgacat cgtcaagggt caaatacagg ttgcttcaga taacatcaag 2280 

gattgtgtaa aatgcttcat tgatgttgtt aacaaggcac tcgaaatgtg cattgatcaa 2340 

gtcactatcg ctggcgcaaa gttgcgatca ctcaacttag gtgaagtctt catcgctcaa 2400 

agcaagggac tttaccgtca gtgtatacgt ggcaaggagc agctgcaact actcatgcct 2460 

cttaaggcac caaaagaagt aacctttctt gaaggtgatt cacatgacac agtacttacc 2520 

tctgaggagg ttgttctcaa gaacggtgaa ctcgaagcac tcgagacgcc cgttgatagc 2580 

ttcacaaatg gagctatcgt tggcacacca gtctgtgtaa atggcctcat gctcttagag 2640 

attaaggaca aagaacaata ctgcgcattg tctcctggtt tactggctac aaacaatgtc 2700 

tttcgcttaa aagggggtgc accaattaaa ggtgtaacct ttggagaaga tactgtttgg 2760 

gaagttcaag gttacaagaa tgtgagaatc acatttgagc ttgatgaacg tgttgacaaa 2820 

gtgcttaatg aaaagtgctc tgtctacact gttgaatccg gtaccgaagt tactgagttt 2880 

gcatgtgttg tagcagaggc tgttgtgaag actttacaac cagtttctga tctccttacc 2940 

aacatgggta ttgatcttga tgagtggagt gtagctacat tctacttatt tgatgatgct 3000 

ggtgaagaaa acttttcatc acgtatgtat tgttcctttt accctccaga tgaggaagaa 3060 

gaggacgatg cagagtgtga ggaagaagaa attgatgaaa cctgtgaaca tgagtacggt 3120 

acagaggatg attatcaagg tctccctctg gaatttggtg cctcagctga aacagttcga 3180 

gttgaggaag aagaagagga agactggctg gatgatacta ctgagcaatc agagattgag 3240 

ccagaaccag aacctacacc tgaagaacca gttaatcagt ttactggtta tttaaaactt 3300 

actgacaatg ttgccattaa atgtgttgac atcgttaagg aggcacaaag tgctaatcct 3360 

atggtgattg taaatgctgc taacatacac ctgaaacatg gtggtggtgt agcaggtgca 3420 
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ctcaacaagg 


caaccaatgg 


tgccatgcaa 


aaggagagtg 


atgattacat taagctaaat 


3480 


ggccctctta 


cagtaggagg 


gtcttgtttg 


ctttctggac 


ataatcttgc 


taagaagtgt 


3540 


ctgcatgttg 


ttggacctaa 


cctaaatgca 


ggtgaggaca 


tccagcttct 


taaggcagca 


3600 


tatgaaaatt 


tcaattcaca 


ggacatctta 


cttgcaccat 


tgttgtcagc 


aggcatattt 


3660 


ggtgctaaac 


cacttcagtc 


tttacaagtg 


tgcgtgcaga 


cggttcgtac 


acaggtttat 


3720 


attgcagtca 


atgacaaagc 


tcrttatgag 


caggttgtca 


tggattatct 


tgataacctg 


3780 


aagcctagag 


tggaagcacc 


taaacaagag 


gagccaccaa 


acacagaaga 


ttccaaaact 


3840 


gaggagaaat 


ctgtcgtaca 


gaagcctgtc 


gatgtgaagc 


caaaaattaa 


ggcctgcatt 


3900 


gatgaggtta 


ccacaacact 


ggaagaaact 


aagtttctta 


ccaataagtt 


actcttgttt 


3960 


gctgatatca 


atggtaagct 


ttaccatgat 


tctcagaaca 


tgcttagagg 


tgaagatatg 


4020 


tctttccttg 


agaaggatgc 


accttacatg 


gtaggtgatg 


ttatcactag 


tggtgatatc 


4080 


acttgtgttg 


taataccctc 


caaaaaggct 


ggtggcacta 


ctgagatgct 


ctcaagagct 


4140 


ttgaagaaag 


tgccagttga 


tgagtatata 


accacgtacc 


ctggacaagg 


atgtgctggt 


4200 


tatacacttg 


aggaagctaa 


gactgctctt 


aagaaatgca 


aatctgcatt 


ttatgtacta 


4260 


ccttcagaag 


cacctaatgc 


taaggaagag 


attctaggaa 


cirgtatcctg 


gaatttgaga 


4320 


gaaatgcttg 


ctcatgctga 


agagacaaga 


aaattraatgc 


ctatatgcat 


ggatgttaga 


4380 


gccataatgg 


caaccatcca 


acgtaagtat 


aaaggaatta 


aaattcaaga gggcatcgtt 


4440 


gactatggtg 


tccgattctt 


cttttatact 


agtaaagagc 


ctgtagcttc tattattacg 


4500 


aagctgaact 


ctctaaatga 


gccgcttgtc 


acaatgccaa 


ttggttatgt 


gacacatggt 


4560 


tttaatcttg 


aagaggctgc 


gcgctgtatg 


cgttctctta 


aagctcctgc 


cgtagtgtca 


4620 


gtatcatcac 


cagatgctgt 


tactacatat 


aatggatacc 


tcacttcgtc 


atcaaagaca 


4680 


tctgaggagc 


actttgtaga 


aacagtttct 


ttggctggct 


cttacagaga ttggtcctat 


4740 


tcaggacagc 


gtacagagtt 


aggtgttgaa 


tttcttraagc 


gtggtgacaa 


aattgtgtac 


4800 


cacactctgg 


agagccccgt: 


cgagtttcat 


cttgacggtg 


aggttctttc 


acttgacaaa 


4860 


ctaaagagtc 


tcttatccct 


gcgggaggtt 


aagactataa 


aagtgttcac 


aactgtggac 


4920 


aacactaatc 


tccacacaca 


gcttgtggat 


atgtctatga 


catatggaca gcagtttggt 


4980 


ccaacatact 


tggatggtgc 


tgatgttaca 


aaaattaaac 


ctcatgtaaa 


tcatgagggt 


5040 


aagactttct 


ttgtactacc 


tagtgatgac 


acactacgta 


gtgaagcttt 


cgagtactac 


5100 


catactcttg 


atgagagttt 


tcttggtagg 


tacatgtctg 


ctttaaacca 


cacaaagaaa 


5160 


tggaaatttc 


ctcaagttgg 


tggtttaact 


tcaattaaat 


gggctgataa 


caattgttat 


5220 


ttgtctagtg 


rtttattagc 


acttcaacag 


cttgaagtca 


aattcaatgc 


accagcactt 


5280 


caagaggctt 


attatagagc 


ccgtgctggt 


gatgctgcta 


acttttgtgc 


actcatactc 


5340 


gcttacagta 


ataaaactgt 


tggcgagctt 


ggtgatgtca 


gagaaactat 


gacccatctt 


5400 


ctacagcatg 


ctaatttgga 


atctgcaaag 


cgagttctta 
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5460 



1er ctepot 



S226CAS111.ST25 

ggtcagaaaa ctactacctt aacgggtgta gaagctgtga tgtatatggg tactctatct 5520 

tatgataatc ttaagacagg tgtttccatt ccatgtgtgt gtggtcgtga tgctacacaa 5580 

tatctagtac aacaagagtc ttcttttgtt atgatgtctg caqcacctgc tgagtataaa 5640 

ttacagcaag gtacattctt atgtgcgaat gagtacactg gtaactatca gtgtggtcat 5700 

tacactcata taactgctaa ggagaccctc tatcgtattg acggagctca ccttacaaag 5760 

atgtcagagt acaaaggacc agtgactgat gttttctaca aggaaacatc ttacactaca 5820 

accatcaagc ctgtgtcgta taaactcgat ggagttactt acacagagat tgaaccaaaa 5880 

ttggatgggt attataaaaa ggataatgct tactatacag agcagcctat agaccttgta 5940 

ccaactcaac cattaccaaa tgcgagtttt gataatttca aactcacatg ttctaacaca 6000 

aaatttgctg atgatttaaa tcaaatgaca ggcttcacaa agccagcttc acgagagcta 6060 

tctgtcacat tcttcccaga cttgaatggc gatgtagtgg ctattgacta tagacactat 6120 

tcagcgagtt tcaagaaagg tgctaaatta ctgcataagc caattgtttg gcacattaac 6180 

caggctacaa ccaagacaac gttxaaacca aacacttggt gtttacgttg tctttggagt 6240 

acaaagccag tagatacttc aaattcattt gaagttctgg cagtagaaga cacacaagga 6300 

atggacaatc ttgcttgtga aagtcaacaa cccacctctg aagaagtagt ggaaaatcct 6360 

accatacaga aggaagtcat agagtgtgac gtgaaaacta ccgaagttgt aggcaatgtc 6420 

atacttaaac catcagatga aggtgttaaa gtaacacaag agttaggtca tgaggatctt 6480 

atggctgctt atgtggaaaa cacaagcatt accattaaga aacctaatga gctttcacta 6540 

gccttaggtt taaaaacaat tgccactcat ggtattgctg caattaatag tgttccttgg 6600 

agtaaaattt tggcttatgt caaaccattc ttaggacaag cagcaattac aacatcaaat 6660 

tgcgctaaga gattagcaca acgtgtgttt aacaattata tgccttatgt gtttacatta 6720 

ttgttccaat tgtgtacttt tactaaaagt accaattcta gaattagagc ttcactacct 6780 

acaactattg ctaaaaatag tgttaagagt gttgctaaat tatgtttgga tgccggcatt 6840 

aattatgtga agtcacccaa attttctaaa ttgttcacaa tcgctatgtg gctattgttg 6900 

ttaagtattt gcttaggttc tctaatctgt gtaactgctg cttttggtgt actcttatct 6960 

aattttggtg ctccttctta ttgtaatggc gttagagaat tgtatcttaa ttcgtctaac 7020 

gttactacta tggatttctg tgaaggttct tttccttgca gcatttgttt aagtggatta 7080 

gactcccttg attcttatcc agctcttgaa accattcagg tgacgatttc atcgtacaag 7140 

ctagacttga caattttagg tctggccgct gagtgggttt tggcatatat gttgttcaca 7200 

aaattctttt atttattagg tctttcagct ataatgcagg tgttctttgg ctattttgct 7260 

agtcatttca tcagcaattc ttggctcatg tggtttatca ttagtattgt acaaatggca 7320 

cccgtttctg caatggttag gatgtacatc ttctttgctt ctttctacta catatggaag 7380 

agctatgttc atatcatgga tggttgcacc tcttcgactt gcatgatgtg ctataagcgc 7440 

aatcgtgcca cacgcgttga gtgtacaact attgttaatg gcatgaagag atctttctat 7500 
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gtctatgcaa 


atggaggccg 


tggcttctgc 


aagactcaca 


attggaattg 


tctcaattgt 


7560 


gacacatttt 


gcactggtag 


tacattcatt 


agtgatgaag 


ttgctcgtga 


tttgtcactc 


7620 


cagtttaaaa 


gaccaatcaa 


ccctactgac 


cagtcatcgt 


atattgttga 


tagtgttgct 


7680 


gtgaaaaatg 


gcgcgcttca 


cctctacttt 


gacaaggctg 


gtcaaaagac 


ctatgagaga 


7740 


catccgctct 


cccattttgt 


caatttagac 


aatttgagag 


ctaacaacac 


taaaggttca 


7800 


ctgcctatta 


atgtcatagt 


ttttgatggc 


aagtccaaat 


gcgacgagtc 


tgcttctaag 


7860 


tctgcttctg 


tgtactacag 


tcagctgatg 


tgccaaccta 


ttctgttgct 


tgaccaagct 


7920 


cttgtatcag 


acgttggaga 


tagtactgaa 


gtttccgtta 


agatgtttga 


tgcttatgtc 


7980 


gacacctttt 


cagcaacttt 


tagtgttcct 


atggaaaaac 


ttaaggcact 


tgttgctaca 


8040 


gctcacagcg 


agttagcaaa 


gggtgtagct 


ttagatggtg 


tcctttctac 


attcgtgtca 


8100 


gctgcccgac 


aaggtgttgt 


tgataccgat 


gttgacacaa 


aggatgttat 


tgaatgtctc 


8160 


aaactttcac 


atcactctga 


cttagaagtg 


acaggtgaca 


gttgtaacaa tttcatgcrtc 


8220 


acctataata 


aggttgaaaa 


catgacgccc 


agagatcttg 


gcgcatgtat 


tgactgtaat 


8280 


gcaaggcata 


tcaatgccca 


agtagcaaaa 


agtcacaatg 


tttcactcat 


ctggaatgta 


8340 


aaagactaca 


tgtctttatc 


tgaacagctg 


cgtaaacaaa 


ttcgtagtgc tgccaagaag 


8400 


aacaacatac 


cttttagact 


aacttgtgct 


acaactagac 


aggttgtcaa tgtcataact 


8460 


actaaaatct 


cactcaaggg 


tggtaagatt 


gttagtactt 


gttttaaact tatgcttaag 


8520 


gccacattat 


tgtgcgttct 


tgctgcattg 


gtttgttata 


tcgttatgcc 


agtacataca 


8580 


ttgtcaatcc 


atgatggtta 


cacaaatgaa 


atcattggtt 


acaaagccat tcaggatggt 


8640 


gtcactcgtg 


acatcatttc 


tactgatgat 


tgttittgcaa 


ataaacatgc tggttttgac 


8700 


gcatggttta 


gccagcgtgg 


tggttcatac 


aaaaatgaca 


aaagctgccc tgtagtaxjct 


8760 


gctatcatta 


caagagagat 


tggtttcata 


gtrgcctggct 


taccgggtac tgtgctgaga 


8820 


gcaatcaatg 


gtgacttctt 


gcattttcta 


cctcgtgttt 


ttagtgctgt 


tggcaacatt 


8880 


tgctacacac 


cttccaaact 


cattgagtat 


agtgattttg 


ctacctctgc 


ttgcgttctt 


8940 


gctgctgagt 


gtacaatttt 


taaggatgct 


atgggcaaac 


ctgtgccata ttgttatgac 


9000 


actaatttgc 


tagagggttc 


tatttcttat 


agtgagcttc 


gtccagacac tcgttatgtg 


9060 


cttatggatg 


gttccatcat 


acagtttcct 


aacacttacc 


tggagggttc tgttagagta 


9120 


gtaacaactt 


ttgatgctga 


gtactgtaga 


catggtacat 


gcgaaaggtc 


agaagtaggt 


9180 


atttgcctat 


ctaccagtgg 


tagatgggtt 


cttaataatg 


agcattacag agctctatca 


9240 


ggagttttct 


gtggtgttga 


tgcgatgaat 


ctcatagcta 


acatctttac tcctcttgtg 


9300 


caacctgtgg 


gtgctttaga 


tgtgtctgct 


tcagtagtgg 


ctggtggtat 


tattgccata 


9360 


ttggtgactt 


gtgctgccta 


ctactttatg 


aaattcagac 


gtgtttttgg tgagtacaac 


9420 


catgttgttg 


ctgctaatgc 


acttttgttt 


ttgatgtctt 


tcactatact 


ctgtctggta 


9480 


ccagcttaca 


gctttctgcc 


gggagtctac 


tcagtctttt 
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ttcaccaatg atgtttcatt cttggctcac cttcaatggt ttgccatgtt ttctcctatt 9600 

gtgccttttt ggataacagc aatctatgta ttctgtattt ctctgaagca ctgccattgg 9660 

ttctttaaca actatcttag gaaaagagtc atgtttaatg gagttacatt tagtaccttc 9720 

gaggaggctg ctttgtgtac ctttttgctc aacaaggaaa tgtacctaaa attgcgtagc 9780 

gagacactgt tgccacttac acagtataac aggtatcttg ctctatataa caagtacaag 9840 

tatttcagtg gagccttaga tactaccagc tatcgtgaag cagcttgctg ccacttagca 9900 

aaggctctaa atgactttag caactcaggt gctgatgttc tctaccaacc accacagaca 9960 

tcaatcactt ctgctgttct gcagagtggt tttaggaaaa tggcattccc gtcaggcaaa 10020 

gttgaagggt gcatggtaca agtaacctgt ggaactacaa ctcttaatgg attgtggttg 10080 

gatgacacag tatactgtcc aagacatgtc atttgcacag cagaagacat gcttaatcct 10140 

aactatgaag atctgctcat tcgcaaatcc aaccatagct ttcttgttca ggctggcaat 10200 

gttcaacttc gtgttattgg ccattctatg caaaattgtc tgcttaggct taaagttgat 10260 

acttctaacc ctaagacacc caagtataaa tttgtccgta tccaacctgg tcaaacattt 10320 

tcagttctag catgctacaa tggtt caeca tctggtgttt atcagtgtgc catgagacct 10380 

aatcatacca ttaaaggttc tttccttaat ggatcatgtg gtagtgttgg ttttaacatt 10440 

gattatgatt gcgtgtcttt ctgctatatg catcatatgg agcttccaac aggagtacac 10500 

gctggtactg acttagaagg taaattctat ggtccatttg ttgacagaca aactgeacag 10560 

getgeaggta cagacacaac cataacatta aatgttttgg catggctgta tgctgctgtt 10620 

atcaatggtg ataggtggtt tcttaataga ttcaccacta ctttgaatga ctttaacctt 10680 

gtggcaatga agtacaacta tgaacctttg acacaagatc atgttgacat attgggacct 10740 

ctttctgctc aaacaggaat tgeegtctta gatatgtgtg ctgctttgaa agagctgetg 10800 

cagaatggta tgaatggtcg tactatcctt ggtagcacta ttttagaaga tgagtttaca 10860 

ccatttgatg ttgttagaca atgctctggt gttaccttcc aaggtaagtt caagaaaatt 10920 

gttaagggca ctcatcattg gatgetttta actttcttga catcactatt gattcttgtt 10980 

caaagtacac agtggtcact gtttttcttt gtttacgaga atgetttett gecatttact 11040 

cttggtatta tggcaattgc tgcatgtgct atgctgcttg ttaagcataa gcacgcattc 11100 

ttgtgcttgt ttctgttacc ttctcttgea acagttgett actttaatat ggtctacatg 11160 

cctgctagct gggtgatgcg tatcatgaca tggcttgaat tggctgacac tagcttgtct 11220 

ggttataggc ttaaggattg tgttatgtat gcttcagctt tagttttget tattctcatg 11280 

acagctcgca ctgtttatga tgatgetget agacgtgttt ggacactgat gaatgtcatt 11340 

acacttgttt acaaagtcta ctatggtaat gctttagatc aagctatttc catgtgggcc 11400 

ttagttattt ctgtaacctc taactattct ggtgtcgtta cgactatcat gtttttagct 11460 

agagctatag tgtttgtgtg tgttgagtat tacccattgt tatttattac tggcaacacc 11520 

ttacagtgta teatgettgt ttattgtttc ttaggctatt gttgctgctg ctactttggc 11580 
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cttttctgtt 


tactcaaccg 


ttacttcagg 


cttactcttg 


gtgtttatga 


ctacttggtc 


11640 


tctacacaag 


aatttaggta 


tatgaactcc 


caggggcttt 


tgcctcctaa 


gagtagtatt 


11700 


gatgctttca 


agcttaacat 


taagttgttg 


ggtattggag 


gtaaaccatg 


tatcaaggtt 


11760 


gctactgtac 


agtctaaaat 


gtctgacgta 


aagtgcacat 


ctgtggtact 


gctctcggtt 


11820 


cttcaacaac 


ttagagtaga 


gtcatcttct 


aaattgtggg 


cacaatgtgt 


acaactccac 


11880 


aatgatattc 


ttcttgcaaa 


agacacaact 


gaagctttcg 


agaagatggt 


ttctcttttg 


11940 


tctgttttgc 


tatccatgca 


gggtgctgta 


gacattaata ggttgtgcga 


ggaaatgctc 


12000 


gataaccgtg 


ctactcttca 


ggctattgct 


tcagaattta 


gttctttacc 


atcatatgcc 


12060 


gcttatgcca 


ctgcccagga 


ggcctatgag 


caggctgtag 


ctaatggtga 


ttctgaagtc 


12120 


gttctcaaaa 


agttaaagaa 


atctttgaat 


gtggctaaat 


ctgagtttga 


ccgtgatgct 


12180 


gccatgcaac 


gcaagttgga 


aaagatggca 


gatcaggcta 


tgacccaaat 


gtacaaacag 


12240 


gcaagatctg 


aggacaagag 


ggcaaaagta 


actagtgcta tgcaaacaat 


gctctrtcact 


12300 


atgcttagga 


agcttgataa 


tgatgcactt 


aacaacatta tcaacaatgc 


gcgtgatggt 


12360 


tgtgttccac 


tcaacatcat 


accattgact 


acagcagcca aactcatggt 


tgttgtccct 


12420 


gattatggta 


cctacaagaa 


cacttgtgat 


ggtaacacct 


ttacatatgc 


atctgcactc 


12480 


tgggaaatcc 


agcaagttgt 


tgatgcggat 


agcaagattg ttcaacttag 


tgaaattaac 


12540 


atggacaatt 


caccaaattt 


ggcttggcct 


cttattgtta 


cagctctaag 


agccaactca 


12600 


gctgttaaac 


tacagaataa 


tgaactgagt 


ccagtagcac tacgacagat 


gtcctgtgcg 


12660 


gctggtacca 


cacaaacagc 


ttgtactgat 


gacaatgcac ttgcctacta 


taacaattcg 


12720 


aagggaggta 


qqtttqtqct 


ggcattacta 


tcagaccacc aagatctcaa 


atgggctaga 


12780 


ttccctaaga 


qtqatqqtac 


aggtacaatt 


tacacagaac tggaaccacc 


ttgtaggttt 


12840 


gttacagaca 


caccaaaagg 


gcctaaagtg 


aaatacttgt acttcatcaa 


aggcttaaac 


12900 


aacctaaata 


qaqqtatgqt 


gctgggcagt 


ttagctgcta 


cagtacgtct 


tcaggctgga 


12960 


aatgctacag 


aagtacctgc 


caattcaact 


gtgctttcct 


txtgtgcttt 


tgcagtagac 


13020 


cctgctaaag 


catataagga 


ttacctagca 


agtggaggac 


aaccaatcac 


caactgtgtg 


13080 


aagatgttgt 


gtacacacac 


tggtacagga 


caggcaatta 


ctgtaacacc 


agaagctaac 


13140 


atggaccaag 


agtcctttgg 


tggtgcttca 


tgttgtctgt 


attgtagatg 


ccacattgac 


13200 


catccaaatc 


ctaaaggatt 


ctgtgacttg 


aaaggtaagt 


acgtccaaat 


acctaccact 


13260 


tgtgctaatg 


acccagtggg 


ttttacactt 


agaaacacag 


tctgtaccgt 


ctgcggaatg 


13320 


tggaaaggtt 


atggctgtag 


ttgtgaccaa 


ctccgcgaac 


ccttgatgca 


gtctgcggat 


13380 


gcatcaacgt 


ttttaaacgg 


gtttgcggtg 


taagtgcagc 


ccgtcttaca 


ccgtgcggca 


13440 


caggcactag 


tactgatgtc 


gtctacaggg 


cttttgatat 


ttacaacgaa 


aaagttgctg 


13500 


gttttgcaaa 


gttcctaaaa 


actaattgct 


gtcgcttcca 


ggagaaggat 


gaggaaggca 


13560 


atttattaga 


ctcttacttt 


gtagttaaga 


ggcatactat gtctaactac 
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agactattta taacttggtt aaagattgtc cagcggttgc tgtccatgac tttttcaagt 13680 

ttagagtaga tggtgacatg gtaccacata tatcacgtca gcgtctaact aaatacacaa 13740 

tggctgattt agtctatgct ctacgtcatt ttgatgaggg taattgtgat acattaaaag 13800 

aaatactcgt cacatacaat tgctgtgatg atgattattt caataagaag gattggtatg 13860 

acttcgtaga gaatcctgac atcttacgcg tatatgctaa cttaggtgag cgtgtacgcc 13920 

aatcattatt aaagactgta caattctgcg atgctatgcg tgatgcaggc attgtaggcg 13980 

tactgacatt agataatcag gatcttaatg ggaactggta cgatttcggt gatttcgtac 14040 

aagtagcacc aggctgcgga gttcctattg tggattcata ttactcattg ctgatgccca 14100 

tcctcacttt gactagggca ttggctgctg agtcccatat ggatgctgat ctcgcaaaac 14160 

cacttattaa gtgggatttg ctgaaatatg attttacgga agagagactt tgtctcttcg 14220 

accgttattt taaatattgg gaccagacat accatcccaa ttgtattaac tgtttggatg 14280 

ataggtgtat ccttcattgt gcaaacttta atgtgttatt ttctactgtg tttccaccta 14340 

caagttttgg accactagta agaaaaatat ttgtagatgg tgttcctttt gttgtttcaa 14400 

ctggatacca ttttcgtgag ttaggagtcg tacataatca ggatgtaaac ttacatagct 14460 

cgcgtctcag tttcaaggaa cttttagtgt atgctgctga tccagctatg catgcagctt 14520 

ctggcaattt attgctagat aaacgcacta catgcttttc agtagctgca ctaacaaaca 14580 

atgttgcttt tcaaactgtc aaacccggta attttaataa agacttttat gactttgctg 14640 

tgtctaaagg tttctttaag gaaggaagtt ctgttgaact aaaacacttc ttctttgctc 14700 

aggatggcaa cgctgctatc agtgattatg actattatcg ttataatctg ccaacaatgt 14760 

gtgatatcag acaactccta ttcgtagttg aagttgttga taaatacttt gattgttacg 14820 

atggtggctg tattaatgcc aaccaagtaa tcgttaacaa tctggataaa tcagctggtt 14880 

tcccatttaa taaatggggt aaggctagac tttattatga ctcaatgagt tatgaggatc 14940 

aagatgcact tttcgcgtat actaagcgta atgtcatccc tactataact caaatgaatc 15000 

ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc tctatctgta 15060 

gtactatgac aaatagacag tttcatcaga aattattgaa gtxaatagcc gccactagag 15120 

gagctactgt ggtaattgga acaagcaagt tttacggtgg ctggcataat atgttaaaaa 15180 

ctgtttacag tgatgtagaa actccacacc ttatgggttg ggattatcca aaatgtgaca 15240 

gagccatgcc taacatgctt aggataatgg cctctcttgt tcttgctcgc aaacataaca 15300 

cttgctgtaa cttatcacac cgtttctaca ggttagctaa cgagtgtgcg caagtattaa 15360 

gtgagatggt catgtgtggc ggctcactat atgttaaacc aggtggaaca tcatccggtg 15420 

atgctacaac tgcttatgct aatagtgtct ttaacatttg tcaagctgtt acagccaatg 15480 

taaatgcact tctttcaact gatggtaata agatagctga caagtatgtc cgcaatctac 15540 

aacacaggct ctatgagtgt ctctatagaa atagggatgt tgatcatgaa ttcgtggatg 15600 

agttttacgc ttacctgcgt aaacatttct ccatgatgat tctttctgat gatgccgttg 15660 
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tgtgctataa cagtaactat gcggctcaag gtttagtagc tagcattaag aactttaagg 15720 

cagttcttta ttatcaaaat aatgtgttca tgtctgaggc aaaatgttgg actgagactg 15780 

accttactaa aggacctcac gaattttgct cacagcatac aatgctagtt aaacaaggag 15840 

atgattacgt gtacctgcct tacccagatc catcaagaat attaggcgca ggctgttttg 15900 

tcgatgatat tgtcaaaaca gatggtacac ttatgattga aaggttcgtg tcactggcta 15960 

ttgatgctta cccacttaca aaacatccta atcaggagta tgctgatgtc tttcacttgt 16020 

atttacaata cattagaaag ttacatgatg agcttactgg ccacatgttg gacatgtatt 16080 

ccgtaatgct aactaatgat aacacctcac ggtactggga acctgagttt tatgaggcta 16140 

tgtacacacc acatacagtc ttgcaggctg taggtgcttg tgtattgtgc aattcacaga 16200 

cttcacttcg ttgcggtgcc tgtattagga gaccattcct atgttgcaag tgctgctatg 16260 

accatgtcat ttcaacatca cacaaattag tgttgtctgt taatccctat gtttgcaatg 16320 

ccccaggttg tgatgtcact gatgtgacac aactgtatct aggaggtatg agctattatt 16380 

gcaagtcaca taagcctccc attagttttc cattatgtgc taatggtcag gtttttggtt 16440 

tatacaaaaa cacatgtgta ggcagtgaca atgtcactga cttcaatgcg atagcaacat 16500 

gtgattggac taatgctggc gattacatac ttgccaacac ttgtactgag agactcaagc 16560 

ttttcgcagc agaaacgctc aaagccactg aggaaacatt taagctgtca tatggtattg 16620 

ccactgtacg cgaagtactc tctgacagag aattgcatct ttcatgggag gttggaaaac 16680 

ctagaccacc attgaacaga aactatgtct ttactggtta ccgtgtaact aaaaatagta 16740 

aagtacagat tggagagtac acctttgaaa aaggtgacta tggtgatgct gttgtgtaca 16800 

gaggtactac gacatacaag ttgaatgttg gtgattactt tgtgttgaca tctcacactg 16860 

taatgccact tagtgcacct actctagtgc cacaagagca ctatgtgaga attactggct 16920 

tgtacccaac actcaacatc tcagatgagt tttctagcaa tgttgcaaat tatcaaaagg 16980 

tcggcatgca aaagtactct acactccaag gaccacctgg tactggtaag agtcattttg 17040 

ccatcggact tgctctctat tacccatctg ctcgcatagt gtatacggca tgctctcatg 17100 

cagctgttga tgccctatgt gaaaaggcat taaaatattt gcccatagat aaatgtagta 17160 

gaatcatacc tgcgcgtgcg cgcgtagagt gttttgataa attcaaagtg aattcaacac 17220 

tagaacagta tgttttctgc actgtaaatg cattgccaga aacaactgct gacattgtag 17280 

tctttgatga aatctctatg gctactaatt atgacttgag tgttgtcaat gctagacttc 17340 

gtgcaaaaca ctacgtctat attggcgatc ctgctcaatt accagccccc cgcacattgc 17400 

tgactaaagg cacactagaa ccagaatatt ttaattcagt gtgcagactt atgaaaacaa 17460 

taggtccaga catgttcctt ggaacttgtc gccgttgtcc tgctgaaatt gttgacactg 17520 

tgagtgcttt agtttatgac aataagctaa aagcacacaa ggataagtca gctcaatgct 17580 

tcaaaatgtt ctacaaaggt gttattacac atgatgtttc atctgcaatc aacagacctc 17640 

aaataggcgt tgtaagagaa tttcttacac gcaatcctgc ttggagaaaa gctgttttta 
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tctcacctta taattcacag aacgctgtag cttcaaaaat cttaggattg cctacgcaga 17760 

ctgttgattc atcacagggt tctgaatatg actatgtcat attcacacaa actactgaaa 17820 

cagcacactc ttgtaatgtc aaccgcttca atgtggctat cacaagggca aaaattggca 17880 

ttttgtgcat aatgtctgat agagatcttt atgacaaact gcaatttaca agtctagaaa 17940 

taccacgtcg caatgtggct acattacaag cagaaaatgt aactggactt tttaaggact 18000 

gtagtaagat cattactggt cttcatccta cacaggcacc tacacacctc agcgttgata 18060 

taaagttcaa gactgaagga ttatgtgttg acataccagg cataccaaag gacatgacct 18120 

accgtagact catctctatg atgggtttca aaatgaatta ccaagtcaat ggttacccta 18180 

atatgtttat cacccgcgaa gaagctattc gtcacgttcg tgcgtggatt ggctttgatg 18240 

tagagggctg tcatgcaact agagatgctg tgggtactaa cctacctctc cagctaggat 18300 

tttctacagg tgttaactta gtagctgtac cgactggtta tgttgacact gaaaataaca 18360 

cagaattcac cagagttaat gcaaaacctc caccaggtga ccagtttaaa catcttatac 18420 

cactcatgta taaaggcttg ccctggaatg tagtgcgtat taagatagta caaatgctca 18480 

gtgatacact gaaaggattg tcagacagag tcgtgttcgt cctttgggcg catggctttg 18540 

agcttacatc aatgaagtac tttgtcaaga ttggacctga aagaacgtgt tgtctgtgtg 18600 

acaaacgtgc aacttgcttt tctacttcat cagatactta tgcctgctgg aatcattctg 18660 

tgggttttga ctatgtctat aacccattta tgattgatgt tcagcagtgg ggctttacgg 18720 

gtaaccttca gagtaaccat gaccaacatt gccaggtaca tggaaatgca catgtggcta 18780 

gttgtgatgc tatcatgact agatgtttag cagtccatga gtgctttgtt aagcgcgttg 18840 

attggtctgt tgaataccct attataggag atgaactgag ggttaattct gcttgcagaa 18900 

aagtacaaca catggttgtg aagtctgcat tgcttgctga taagtttcca gttcttcatg 18960 

acattggaaa tccaaaggct atcaagtgtg tgcctcaggc tgaagtagaa tggaagttct 19020 

acgatgctca gccatgtagt gacaaagctt acaaaataga ggaactcttc tattcttatg 19080 

ctacacatca cgataaattc actgatggtg tttgtttgtt ttggaattgt aacgttgatc 19140 

gttacccagc caatgcaatt gtgtgtaggt ttgacacaag agtcttgtca aacttgaact 19200 

taccaggctg tgatggtggt agtttgtatg tgaataagca tgcattccac actccagctt 19260 

tcgataaaag tgcatttact aatttaaagc aattgccttt cttttactat tctgatagtc 19320 

cttgtgagtc tcatggcaaa caagtagtgt cggatattga ttatgttcca ctcaaatctg 19380 

ctacgtgtat tacacgatgc aatttaggtg gtgctgtttg cagacaccat gcaaatgagt 19440 

accgacagta cttggatgca tataatatga tgatttctgc tggatttagc ctatggattt 19500 

acaaacaatt tgatacttat aacctgtgga atacatttac caggttacag agtttagaaa 19560 

atgtggctta taatgttgtt aataaaggac actttgatgg acacgccggc gaagcacctg 19620 

tttccatcat taataatgct gtttacacaa aggtagatgg tattgatgtg gagatctttg 19680 

aaaataagac aacacttcct gttaatgttg catttgagct ttgggctaag cgtaacatta 19740 
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aaccagtgcc 


agagattaag 


atactcaata 


taatctggga 


ctacaaaaga 


gaagccccag 


tgactgacat 


tgccaagaaa 


cctactgaga 


atggtagagt 


ggaaggacag 


gtagaccttt 


cagaaggttc 


agtcaaaggt 


ctaacacctt 


gagtcacatt 


aattggagaa 


tcagtaaaaa 


gcattattca 


acagttgcct 


gaaacctact 


agcccagatc 


acaaatggaa 


actgactttc 


gatataagct 


cgagggctat 


gccttcgaac 


aacttggcgg 


tcttcattta 


atgataggct 


aattagagga 


ttttatccct 


atggacagca 


aaacaggttc 


atcaaaatgt 


gtgtgttctg 


agataataaa 


gtcacaagat 


ttgtcagtga 


atgctgaaat 


ttcattcatg 


ctttggtgta 


aactacaagc 


aagtcaagcg 


tggcaaccag 


aaagaatgct 


tcttgaaaag 


tgtgaccttc 


aaggaataat 


gatgaatgtc 


gcaaagtata 


ctttagctgt 


accctacaac 


atgagagtta 


ttgcaccagg 


tacagctgtg 


ctcagacaat 


cagatcttaa 


tgacttcgtc 


tccgacgcag 


tacatacggc 


taataaatgg 


gaccttatta 


atgtgacaaa 


agagaatgac 


tctaaagaag 


agcaaaaact 


agccctgggt 


ggttctatag 


ctgaccttta 


caagcttatg 


ggccatttct 


atgcatcatc 


atcggaagca 


tttttaattg 


aaattgatgg 


ctataccatg 


catgctaact 


agttgtcttc 


ctattcactc 


tttgacatga 


ctgtaatgtc 


tcttaaggag 


aatcaaatca 


gtaggcttat 


cattagagaa 


aacaacagag 


actaaacgaa 


catgtttatt 


ttcttattat 


accggtgcac 


cacttttgat 


gatgttcaag 


tgaggggggt 


ttactatcct 


gatgaaattt 


atttatttct 


tccattttat 


tctaatgtta 


gcaaccctgt 


catacctttt 


aaggatggta 
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atttgggtgt tgatatcgct gctaatactg 19800 

cacatgtatc tacaataggt gtctgcacaa 19860 

gtgcttgttc ttcacttact gtcttgtttg 19920 

ttagaaacgc ccgtaatggt gttttaataa 19980 

caaagggacc agcacaagct agcgtcaatg 20040 

cacagtttaa ctactttaag aaagtagacg 20100 

ttactcagag cagagactta gaggattrta 20160 

tcgagctcgc tatggatgaa ttcatacagc 20220 

acatcgttta tggagatttc agtcatggac 20280 

tagccaagcg ctcacaagat tcaccactta 20340 

cagtgaaaaa ttacttcata acagatgcgc 20400 

tgattgatct tttacttgat gactttgtcg 20460 

tttcaaaagt ggtcaaggtn acaattgact 20520 

aggatggaca tgttgaaacc ttctacccaa 20580 

gtgttgcgat gcctaacttg tacaagatgc 20640 

agaattatgg tgaaaatgct gttataccaa 20700 

ctcaactgtg tcaatactta aatacactta 20760 

ttcactttgg tgctggctct gataaaggag 20820 

ggttgccaac tggcacacta cttgtcgatt 20880 

attctacttt aattggagac tgtgcaacag 20940 

ttagcgatat gtatgaccct aggaccaaac 21000 

ggtttttcac ttatctgtgt ggatttataa 21060 

ctgtaaagat aacagagcat tcttggaatg 21120 

catggtggac agcttttgtt acaaatgtaa 21180 

gggctaacta tcttggcaag ccgaaggaac 21240 

acattttctg gaggaacaca aatcctatcc 21300 

gcaaatttcc tcttaaatta agaggaactg 21360 

atgatatgat ttattctctt ctggaaaaag 21420 

ttgtggtttc aagtgatatt cttgttaaca 21480 

ttcttactct cactagtggt agtgaccttg 21540 

ctcctaatta cactcaacat acttcatcta 21600 

ttagatcaga cactctttat ttaactcagg 21660 

cagggtttca tactattaat catacgtttg 21720 

tttattttgc tgccacagag aaatcaaatg 21780 
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ttgtccgtgg ttgggttttt ggttctacca tgaacaacaa gtcacagtcg gtgattatta 21840 

ttaacaattc tactaatgtt gttatacgag catgtaactt tgaattgtgt gacaaccctt 21900 

tctttgctgt ttctaaaccc atgggtacac agacacatac tatgatattc gataatgcat 21960 

ttaattgcac tttcgagtac atatctgatg ccttttcgct tgatgtttca gaaaagtcag 22020 

gtaattttaa acacttacga gagtttgtgt ttaaaaataa agatgggttt ctctatgttt 22080 

ataagggcta tcaacctata gatgtagttc gtgatctacc ttctggtttt aacactttga 22140 

aacctatttt taagttgcct cttggtatta acattacaaa ttttagagcc attcttacag 22200 

ccttttcacc tgctcaagac atttggggca cgtcagctgc agcctatttt gttggctatt 22260 

taaagccaac tacatttatg ctcaagtatg atgaaaatgg tacaatcaca gatgctgttg 22320 

attgttctca aaatccactt gctgaactca aatgctctgt taagagcttn gagattgaca 22380 

aaggaattta ccagacctct aatttcaggg ttgttccctc aggagatgtt gtgagattcc 22440 

ctaatattac aaacttgtgt ccttttggag aggtttttaa tgctactaaa ttcccttctg 22500 

tctatgcatg ggagagaaaa aaaatttcta attgtgttgc tgattactct gtgctctaca 22560 

actcaacatt tttttcaacc tttaagtgct atggcgtttc tgccactaag ttgaatgatc 22620 

tttgcttctc caatgtctat gcagattctt ttgtagtcaa gggagatgat gtaagacaaa 22680 

tagcgccagg acaaactggt gttattgctg attataatta taaattgcca gatgatttca 22740 

tgggttgtgt ccttgcttgg aatactagga acattgatgc tacttcaact ggtaattata 22800 

attataaata taggtatctt agacatggca agcttaggcc ctttgagaga gacatatcta 22860 

atgtgccttt ctcccctgat ggcaaacctt gcaccccacc tgctcttaat tgttattggc 22920 

cattaaatga ttatggtttt tacaccacta ctggcattgg ctaccaacct tacagagttg 22980 

tagtactttc ttttgaactt ttaaatgcac cggccacggt ttgtggacca aaattatcca 23040 

ctgaccttat taagaaccag tgtgtcaatt ttaattttaa tggactcact ggtactggtg 23100 

tgttaactcc ttcttcaaag agatttcaac catttcaaca atttggccgt gatgtttctg 23160 

atttcactga ttccgttcga gatcctaaaa catctgaaat attagacatt tcaccttgct 23220 

cttttggggg tgtaagtgta attacacctg gaacaaatgc ttcatctgaa gttgctgttc 23280 

tatatcaaga tgttaactgc actgatgttt ctacagcaat tcatgcagat caactcacac 23340 

cagcttggcg catatattct actggaaaca atgtattcca gactcaagca ggctgtctta 23400 

taggagctga gcatgtcgac acttcttatg agtgcgacat tcctattgga gctggcattt 23460 

gtgctagtta ccatacagtt tctttattac gtagtactag ccaaaaatct attgtggctt 23520 

atactatgtc tttaggtgct gatagttcaa ttgcttactc taataacacc attgctatac 23580 

ctactaactt ttcaattagc attactacag aagtaatgcc tgtttctatg gctaaaacct 23640 

ccgtagattg taatatgtac atctgcggag attctactga atgtgctaat ttgcttctcc 23700 

aatatggtag cttttgcaca caactaaatc gtgcactctc aggtattgct gctgaacagg 23760 

atcgcaacac acgtgaagtg ttcgctcaag tcaaacaaat gtacaaaacc ccaactttga 23820 
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aatattttgg tggttttaat ttttcacaaa tattacctga ccctctaaag ccaactaaga 23880 

ggtcttttat tgaggacttg ctctttaata aggtgacact cgctgatgct ggcttcatga 23940 

agcaatatgg cgaatgccta ggtgatatta atgctagaga tctcatttgt gcgcagaagt 24000 

tcaatggact tacagtgttg ccacctctgc tcactgatga tatgattgct gcctacactg 24060 

ctgctctagt tagtggtact gccactgctg gatggacatt tggtgctggc gctgctcttc 24120 

aaataccttt tgctatgcaa atggcatata ggttcaatgg cattggagtt acccaaaatg 24180 

ttctctatga gaaccaaaaa caaatcgcca accaatttaa caaggcgatt agtcaaattc 24240 

aagaatcact tacaacaaca tcaactgcat tgggcaagct gcaagacgtt gttaaccaga 24300 

atgctcaagc attaaacaca cttgttaaac aacttagctc taattttggt gcaatttcaa 24360 

gtgtgctaaa tgatatcctt tcgcgacttg ataaagtcga ggcggaggta caaattgaca 24420 

ggttaattac aggcagactt caaagccttc aaacctatgt aacacaacaa ctaatcaggg 24480 

ctgctgaaat cagggcttct gctaatcttg ctgctactaa aatgtctgag tgtgttxttg 24540 

gacaatcaaa aagagttgac utttgtggaa agggctacca ccttatgtcc ttcccacaag 24600 

cagccccgca tggtgttgtc ttcctacatg tcacgtatgt gccatcccag gagaggaact 24660 

tcaccacagc gccagcaatt tgtcatgaag gcaaagcata cttccctcgt gaaggtgttt 24720 

ttgtgtttaa tggcacttct tggtttatta cacagaggaa cttcttttct ccacaaataa 24780 

ttactacaga caatacattt gtctcaggaa attgtgatgt cgttattggc atcattaaca 24840 

acacagttta tgatcctctg caacctgagc ttgactcatt caaagaagag ctggacaagt 24900 

acttcaaaaa tcatacatca ccagatgttg atcttggcga catttcaggc attaacgctt 24960 

ctgtcgtcaa cattcaaaaa gaaattgacc gcctxaatzga ggtcgctaaa aatttaaatg 25020 

aatcactcat tgaccttcaa gaattgggaa aatatgagca atatattaaa tggcctrtggt 25080 

atgtttggct cggcttcatt gctggactaa ttgccatcgt catggttaca atcttgcttt 25140 

gttgcatgac tagttgttgc agttgcctca agggtgcatg ctcttgtggt tcttgctrgca 25200 

agtttgatga ggatgactct gagccagttc tcaagggtgt caaattacat tacacataaa 25260 

cgaacttatg gatttgttta tgagattttt tactcttgga tcaattactg cacagccagt 25320 

aaaaattgac aatgcttctc ctgcaagtac tgttcatgct acagcaacga taccgctaca 25380 

agcctcactc cctttcggat ggcttgttat tggcgttgca tttcttgctg tttttcagag 25440 

cgctaccaaa ataattgcgc tcaataaaag atggcagcta gccctttata agggcttcca 25500 

gttcatttgc aatttactgc tgctatttgt taccatctat tcacatcttt tgcttgtcgc 25560 

tgcaggtatg gaggcgcaat ttttgtacct ctatgccttg atatattttc tacaatgcat 25620 

caacgcatgt agaattatta tgagatgttg gctttgttgg aagtgcaaat ccaagaaccc 25680 

attactttat gatgccaact actttgtttg ctggcacaca cataactatg actactgtat 25740 

accatataac agtgtcacag atacaattgt cgttactgaa ggtgacggca tttcaacacc 25800 

aaaactcaaa gaagactacc aaattggtgg ttattctgag gataggcact caggtgttaa 25860 
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agactatgtc gttgtacatg gctatttcac cgaagtttac taccagcttg agtctacaca 25920 

aattactaca gacactggta ttgaaaatgc tacattcttc atctttaaca agcttgttaa 25980 

agacccaccg aatgtgcaaa tacacacaat cgacggctct tcaggagttg ctaatccagc 26040 

aatggatcca atttatgatg agccgacgac gactactagc gtgcctttgt aagcacaaga 26100 

aagtgagtac gaacttatgt actcattcgt ttcggaagaa acaggtacgt taatagttaa 26160 

tagcgtactt ctttttcttg ctttcgtggt attcttgcta gtcacactag ccatccttac 26220 

tgcgcttcga ttgtgtgcgt actgctgcaa tattgttaac gtgagtttag taaaaccaac 26280 

ggtttacgtc tactcgcgtg ttaaaaatct gaactcttct gaaggagttc ctgatcttct 26340 

ggtctaaacg aactaactat tattattatt ctgtttggaa ctttaacatt gcttatcatg 26400 

gcagacaacg gtactattac cgttgaggag cttaaacaac tcctggaaca atggaaccta 26460 

gtaataggtt tcctattcct agcctggatt atgttactac aatttgccta ttctaatcgg 26520 

aacaggtttt tgtacataat aaagcttgtt ttcctctggc tcttgtggcc agtaacactt 26580 

gcttgttttg tgcttgctgc tgtctacaga attaattggg tgactggcgg gattgcgatt 26640 

gcaatggctt gtattgtagg cttgatgtgg cttagctact tcgttgcttc cttcaggctg 26700 

tttgctcgta cccgctcaat gtggtcattc aacccagaaa caaacattct tctcaatgtg 26760 

cctctccggg ggacaattgt gaccagaccg ctcatggaaa gtgaacttgt cattggtgct 26820 

gtgatcattc gtggtcactt gcgaatggcc ggacactccc tagggcgctg tgacattaag 26880 

gacctgccaa aagagatcac tgtggctaca tcacgaacgc tttcttatta caaattagga 26940 

gcgtcgcagc gtgtaggcac tgattcaggt tttgctgcat acaaccgcta ccgtattgga 27000 

aactataaat taaatacaga ccacgccggt agcaacgaca atattgcttt gctagtacag 27060 

taagtgacaa cagatgtttc atcttgttga cttccaggtt acaatagcag agatattgat 27120 

tatcattatg aggactttca ggattgctat ttggaatctt gacgttataa taagttcaat 27180 

agtgagacaa ttatttaagc ctctaactaa gaagaattat tcggagttag atgatgaaga 27240 

acctatggag ttagattatc cataaaacga acatgaaaat tattctcttc ctgacattga 27300 

ttgtatttac atcttgcgag ctatatcact atcaggagtg tgttagaggt acgactgtac 27360 

tactaaaaga accttgccca tcaggaacat acgagggcaa ttcaccattt caccctcttg 27420 

ctgacaataa atttgcacta acttgcacta gcacacactt tgcttttgct tgtgctgacg 27480 

gtactcgaca tacctatcag ctgcgtgcaa gatcagtttc accaaaactt ttcatcagac 27540 

aagaggaggt tcaacaagag ctctactcgc cactttttct cattgttgct gctctagtat 27600 

ttttaatact ttgcttcacc attaagagaa agacagaatg aatgagctca ctttaattga 27660 

cttctatttg tgctttttag cctttctgct attccttgtt ttaataatgc ttattatatt 27720 

ttggttttca ctcgaaatcc aggatctaga agaaccttgt accaaagtct aaacgaacat 27780 

gaaacttctc attgttttga cttgtatttc tctatgcagt tgcatatgca ctgtagtaca 27840 

gcgctgtgca tctaataaac ctcatgtgct tgaagatcct tgtaaggtac aacactaggg 27900 
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gtaatactta 


tagcactgct 


tggctttgtg 


ctctaggaaa 


qgttttacct 


tttcatagat 


27960 


ggcacactat 


ggttcaaaca 


tgcacaccta 


atgttactat 


caactgtcaa 


gatccagctg 


28020 


qtqqtqcqct 


tatagctagg 


tqttqqtacc 


ttcatgaagg 


tcaccaaact 


getgeattta 


28080 


gagacgtact 


tgttgtttta 


aataaacgaa 


caaattaaaa 


tgtctgataa 


tggaccccaa 


28140 


tcaaaccaac 


gtagtgcccc 


ccgcattaca 


tttggtggac 


ccacagattc 


aactgacaat 


28200 


aaccaaaata 


aaaaacacaa 


taaaacaaaa 
*-y yyy v - yy 


ccaaaacagc 


gccgacccca 


aggtttaccc 


28260 


aataatacta 


ca t ct t a a tt 


cacaactctc 


actcaa cat:a 

VA \_ V- V*ilAy KA. 1» ^ 


acaaaaaaaa 


acttagattc 


28320 


»— y y y 


aaaacattcc 
yy y y **^»*— 


aatcaacacc 


aat aat a ate 

**** *"**y 


caaataacca 


aattaactac 


28380 


taccoaaaaa 

i_uv_v_y aciy ciy 




aattcataat 

ct-y i. i» y tyy i. 


yy L y av -y y v - u 


aaataaaaaa 


actcaacccc 


28440 


aaataatact 

a y Q N-yy u.c**— v. 


tctattacct 


y y u ^yy*- 


ccaaaaactt 


cacttcccta 


caacactaac 

V* *J *y Vrf \A 


28500 


aaaaaaaa ca 


tcatataaat 


tacaactaaa 


aaaaccttaa 


atacacccaa 


agaccacatt 


28560 


ggcacccgca 


atcct aat aa 


caatgctgcc 


accgtgctac 


aacttcctca 


aggaacaaca 


28620 


ttgccaaaag 


gcttctacgc 


aqaqqqaaqc 


aqaqqcqqca 


gtcaagcctc 


ttctcgctcc 


28680 


tcatcacgta 


qtcqcqqtaa 


ttcaagaaat 


tcaactcctg 


gcagcagtag 


gggaaattct 


28740 


cctgctcgaa 


tqqctaqcqq 


aqqtqqtqaa 


actgccctcg 


egctattget 


gctagacaga 


28800 


ttgaaccagc 


ttaaaaacaa 


aatttctaqt 


aaaggecaac 


aacaacaagg 


ccaaactgtc 


28860 


actaagaaat 


eta eta eta a 


ggcatctaaa 


aaocctcacc 


aaaaaegtae 


tgccacaaaa 


28920 


cagtacaacg 


tcactcaaac 


atttaaaaaa 


cataatccaa 


aacaaaccca 


aggaaatttc 


28980 


aaaaaccaaa 


acctaatcaa 


acaaaaaact 


aattacaaac 


attaaccaca 


aattgcacaa 


29040 


tttartcraa 


fltarrtctar 


attrtttnaa 


atatcafara 


ttaacataaa 


aatcacacct 


29100 


yy y 


yy v— Lyav. ut« 


v-v_ol Lyy ay v_i_ 


attaaattao 

o c Luuu \_ Lyy 


cl uy Qv_aau.y a. 


trcacaattc 


29160 


aaaaacaaca 




yciav,auy ^.cx. v. 


attaararat 


araaaacatt 


rc caccaaca 


29220 


aaacctaaaa 


aaaacaaaaa 


aaaaaaaact 


aataaaactc 


aacctttacc 


acaaaaacaa 


29280 


aagaagcagc 


ccactgtgac 


tcttcttcct 


acaactaaca 


tggatgattt 


ctccagacaa 


29340 


cttcaaaatt 


ccataaataa 


agettctget 


gattcaactc 


aggcataaac 


actcatgatg 


29400 


accacacaag 


qcaoatqqac 


tatgtaaacg 


ttttcgcaat 


tccgtttacg 


atacatagtc 


29460 


tactcttgtg 


cagaatgaat 


tetegtaact 


aaacagcaca 


agtaggttta 


gttaac l t ta 




atctcacata 


gcaatcttta 


atcaatgtgt 


aacattaggg 


aggacttgaa 


agagccacca 


29580 


cattttcatc 


gaggccacgc 


ggagtacgat 


cgagggtaca 


gtgaataatg 


ctagggagag 


29640 


ctgcctatat 


ggaagagece 


taatgtgtaa 


aattaatttt 


agtagtgcta 


tccccatgtg 


29700 


attttaatag 


cttcttagga 


gaatgacaaa 


aaaaaaaaaa 


aaaaaa 




29746 



<210> 2<211> 3945<212> DNA<213> CORONAVIRUS<220><221> CDS<222> 
C89). .(3853)<223> 

<400> 2 
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ttctcttctg gaaaaaggta ggcttatcat tagagaaaac aacagagttg tggtttcaag 60 

tgatattctt gttaacaact aaacgaac atg ttt att ttc tta tta ttt ctt 112 

Met Phe lie Phe Leu Leu Phe Leu 
1 5 

act etc act agt got agt gac ctt gac egg tgc acc act ttt gat qat 160 
Thr Leu Thr ser cTy ser Asp Leu Asp Arg Cys Thr Thr Phe Asp Asp 
10 15 20 

gtt caa get cct aat tac act caa cat act tea tct atg agg gqg qtt 208 
val Gin Ala Pro Asn Tyr Thr Gin His Thr Ser ser Met Arg G?y val 
25 30 35 a 40 

tac tat cct gat gaa att ttt aga tea gac act ctt tat tta act caq 256 
Tyr Tyr Pro Asp Glu lie Phe Arg Ser Asp Thr Leu Tyr Leu Thr Gin 
45 50 55 

gat tta ttt ctt cca ttt tat tct aat gtt aca ggg ttt cat act att 304 
Asp Leu Phe Leu Pro Phe Tyr ser Asn val Thr G?y Phe His Thr ill ° 4 
60 65 70 

5?5 ^u 9 HI:* ggc aac cct gtc ata cct «t aag gat ggt att tat 352 
Asn His Thr Phe Gly Asn Pro Val lie Pro Phe Lys Asp Gly lie Tyr 

80 85 

III ^ g ? C gag aaa tca aat 9tt gtc cgt ggt tgg gtt ttt qqt 400 
Phe Ala Ala Thr Glu Lys ser Asn val Val Arg Gly Trp val Phe gTv 
yo 95 100 

lS Z c ?. t9 aac aac aa 9 tca ca 9 teg gtg att att att aac aat tct 448 
ser Thr Met Asn Asn Lys ser Gin se? VaT He He lie Asn Asn ser 
10b HO 115 120 

xhr t.l 8£i a ^ a - ga g f a tgt aac ttz gaa ttg tat 9 ac aa c cct 496 
Thr Asn val val lie Arg Ala Cys Asn Phe Glu Leu Cys Asp Asn pro 

125 130 135 

III III 9.il S3? o Ct aaa ccc atg ggt aca ca 9 aca cat a ct atg ata 544 
Phe Phe Ala val ser Lys Pro Met Gly Thr Gin Thr His Thr Met lie 

140 145 150 

ttc gat aat gca ttt aat tgc act ttc gag tac ata tct oat acc ttt sq? 
Phe Asp Asn Ala Phe Asn Cys Thr Phe Glu Tyr lie ser Asp Ala Phe 
155 160 165 

tlr ?IT, 1*1 S3? c ca 2 aa aag tca ggt aat tt:t aaa cac tta cga gag 640 
ser Leu Asp val ser Glu Lys ser Gly Asn Phe Lys His Leu Arg hu 

170 175 180 

IV" g , tg t £ t aaa aat aaa Sat ggg ttt etc tat gtt tat aaa aac tat «rr 
Phe VaT Phe Lys Asn Lys Asp Gly Phe Leu Tyr val Tyr Lyl G?y Tyr 688 
xo:> 190 195 200 

£ aa £ ct ^ a gat 9 ta Stt cgt gat eta cct tct ggt ttt aac act tta 736 
Gin Pro lie Asp val Val Arg Asp Leu Pro Ser cTy Phe Asn Thr ilu 
205 210 215 

aaa £ ct t}*- t J t aag ttg cct ctt 99* at * aa c att aca aat ttt aaa 784 
Lys Pro lie Phe Lys Leu Pro Leu Gty lie Asn He Thr Asn Phe A?g 
220 225 230 

?if tt* Ctt 2 ca gcc t J t tca cct gct caa 9 ac a tt tgg ggc acg tca 832 
Ala He Leu Thr Ala Phe ser Pro Ala Gin Asp He Trp gTv Thr Ser 
235 240 245 

fi a 9 ? C 3 at gt ? ggc tat tta aa 9 cca act aca ttt atg etc 880 
Ala Ala Ala Tyr Phe Val cTy Tyr Leu Lys Pro Thr Thr Phe Met Leu 
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250 255 260 

aag tat gat gaa aat gat aca ate aca gat get gtt gat tgt tct caa 
Lys Tyr Asp Glu Asn Gly Thr lie Thr Asp Ala Val Asp Cys Ser Gin 
265 270 275 280 



928 



aat cca ctt get gaa etc aaa tgc tct gtt aag age ttt gag att gac 976 
Asn Pro Leu Ala Glu Leu Lys Cys ser Val Lys Ser Phe Glu lie Asp 
285 290 295 

aaa gqa att tac cag ace tct aat ttc agg gtt gtt ccc tea gqa gat 1024 
Lys Gly lie Tyr Gin Thr Ser Asn Phe Arg val Val Pro Ser Gly Asp 
300 305 310 

gtt gtg aga ttc cct aat att aca aac ttg tgt cct ttt gqa gag gtt 1072 
val Val Arg Phe Pro Asn lie Thr Asn Leu cys pro Phe Gly Glu val 
315 320 325 

ttt aat get act aaa ttc cct tct gtc tat gca tgg gag aga aaa aaa 1120 
Phe Asn Ala Thr Lys Phe Pro ser Val Tyr Ala Trp Glu Arg Lys Lys 
330 335 340 

att tct aat tgt gtt get gat tac tct gtg etc tac aac tea aca ttt 1168 
lie Ser Asn cys val Ala Asp Tyr Ser Val Leu Tyr Asn ser Thr Phe 
345 350 355 360 

ttt tea ace ttt aag tgc tat gqc gtt tct gee act aag ttg aat gat 1216 
Phe ser Thr Phe Lys Cys Tyr Gly val ser Ala Thr Lys Leu Asn Asp 
365 370 375 

ctt tgc ttc tec aat gtc tat gca gat tct ttt gta gtc aag gqa gat 1264 
Leu cys Phe ser Asn Val Tyr Ala Asp Ser Phe val Val Lys Gly Asp 
380 385 390 

gat gta aga caa ata gcg cca gqa caa act gqt gtt att get gat tat 1312 
Asp val Arg Gin lie Ala Pro Gly Gin Thr Gly val lie Ala Asp Tyr 
395 400 405 

aat tat aaa ttg cca gat gat ttc atg gqt tgt gtc ctt get tgg aat 1360 
Asn Tyr Lys Leu Pro Asp Asp Phe Met Gly Cys val Leu Ala Trp Asn 
410 415 420 

act agg aac att gat get act tea act gqt aat tat aat tat aaa tat 1408 
Thr Arg Asn lie Asp Ala Thr ser Thr Gly Asn Tyr Asn Tyr Lys Tyr 
425 430 435 440 

agg tat ctt aga cat gqc aag ctt agg ccc ttt gag aga gac ata tct 1456 
Arg Tyr Leu Arg His Gly Lys Leu Arg Pro Phe Glu Arg Asp lie ser 
445 450 455 

aat gtg cct ttc tec cct gat gqc aaa cct tgc ace cca cct get ctt 1504 
Asn val Pro Phe Ser Pro Asp Gly Lys pro Cys Thr Pro Pro Ala Leu 
460 465 470 



aat tgt tat tgg cca tta aat gat tat gqt ttt tac ace act act gqc 1552 
Asn Cys Tyr Trp Pro Leu Asn Asp Tyr Gly Phe Tyr Thr Thr Thr Gly 
475 480 485 



att gqc tac caa cct tac aga gtt gta gta ctt tct ttt gaa ctt tta 1600 

lie Gly Tyr Gin Pro Tyr Arg val Val Val Leu Ser Phe Glu Leu Leu 
490 495 500 

aat gca ccg gee acg gtt tgt gga cca aaa tta tec act gac ctt att 1648 

Asn Ala pro Ala Thr val cys Gly Pro Lys Leu Ser Thr Asp Leu lie 
505 510 515 520 

aag aac cag tgt gtc aat ttt aat ttt aat gqa etc act gqt act gqt 1696 

Lys Asn Gin Cys Val Asn phe Asn Phe Asn Gly Leu Thr Gly Thr Gly 
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630 

act tct tat gag tgc 2032 
r ser Tyr Glu cys 
645 



S226CAS111.ST25 
525 530 535 

vll ?S I Ct l ca aag aga t ] tt caa cca «t caa caa ttt ggc 1744 

val Leu Thr Pro ser ser Lys Arg Phe Gin pro phe Gin Gin Phe gTv 

- >4U 545 550 

cgt gat gtt tct gat ttc act gat tec gtt caa aat cct aaa ara t-r-i- i7<r> 
Arg Asp val Ser Asp Phe Thr Xsp ser val Z?g gf pS fJS ?£r IS 92 
5:>:> 560 " 565 

gaa ata tta gac att tea cct tgc tct ttt ggg qqt qta aat ata ai-t- i«4n 
Glu lie Leu Asp lie Ser Pro cys ser Phe G?y SfJ val s£ Val ?le ° 
- >/u 575 580 

jff SSS I?? IS? SSS || IS? IS 8! S3 ||S S3 a - a; n — 
S3 SIS SSS IS? SIS S3 IS? » XS SJ SS SS SS SS SS «? 1936 

bu:> 610 615 

s ss || is # is? is? a; as sis ss? sj sis is; ss 1984 

o^u 625 

?i a 2 gc 5 9t ctt a S a 9? a 9 ct 9 a ° cat gtc gac ac 
Ala Gly cys Leu lie Gly Ala Glu His Val Asp Th 
635 640 

sis is ss is 1?? ss as ?s sj ss ss 55; ss is? S3 is? 2080 

JU o55 660 

tta tta cgt agt act age caa aaa tct att gtq qct tat act ata 1-n- m ?s 
Leu Leu Arg ser Thr ser Gin Lys Ser He SaT Ala Tyr Thr Se? sS 

670 675 680 

SS 85 SS SIS IIS IS? SS SS 15? IS SS SS IS? |?S ffi; ffi 2 ™ 

b85 690 695 

SS is? SIS SSS IS? IS IIS IS IS? IS? SS SS? S3 SSS S3 IS? 2224 

/uu 705 710 

SS? SS SI ISS ISS 83 SIS SSS SIS SS? I?S l?S S?S I?? SIS IS? 2222 

-° 720 725 

Th^ F-?? ^ 9t 2^ aat ttg ctt «c caa tat ggt age ttt tqc aca caa ?*jc> 
Thr Glu cys Ala Asn Leu Leu Leu Gin Tyr 1% sir Phe cys Th? Gin 2320 
/JU /35 740 

SS sis s?s s?i ss is? m IS SS SS SS SS SIS S?S SIS IS? 2368 

S?S SS 33 ISS SS SS S3 51 SS SS? 15? 15? ISS SSS IS? £2 2416 

/ ob 770 775 

i5i 15? sss sj ss sss sis sss is? ss is sss sss iii SSS SS 24M 

151 SSS IS? S5i 38 IS? SSS IS 88 SIS SS8 SSS SSS SIS S5i SS? 2512 
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aca etc get gat 
Thr Leu Ala Asp 
810 

gat att aat get 
Asp lie Asn Ala 
825 

aca gtg ttg cca 
Thr VaT Leu Pro 



S226CAS1U.ST25 
800 805 

act ggc ttc atg aag caa tat ggc gaa tgc eta ggt 
Ala Gly Phe Met Lyi Gin Tyr Gly Glu Cys Leu Gly 

820 



815 



get get 
Ala Ala 



ggc get 
Gly Ala 



aat ggc 
Asn Gly 
890 

ate gee 
lie Ala 
905 



aca aca 
Thr Thr 



eta gtt 
Leu val 
860 

get ctt 
Ala Leu 
875 

att gga 
Xle Gly 



aga gat etc att tgt gcg cag aag ttc aat gga ctt 
Arg Asp Leu He cys Ala Gin Lys Phe Asn Gly Leu 
830 835 * 4U 

cct ctg etc act gat gat atg att get gee tac act 
Pro Leu Leu Thr Asp Asp Met lie Ala Ala Tyr Thr 
845 850 855 

agt ggt act gec act get gga tgg aca ttt ggt get 
ir Gly Thr Ala Thr Ala Gly Trp Thr Phe Gly Ala 
865 870 



ser 



aac caa 
Asn Gin 



aca tea 
Thr ser 



aat get 
Asn Ala 



ggt gca 
Gly Ala 



gtc gag 
val Glu 
970 

age ctt 
Ser Leu 
985 

agg get 
Arg Ala 



caa ata cct ttt get atg caa atg gca tat agg ttc 
Gin lie Pro Phe Ala Met Gin Met Ala Tyr Arg Phe 
880 885 

gtt ace caa aat gtt etc tat gag aac caa aaa caa 
val Thr Gin Asn Val Leu Tyr Glu Asn Gin Lys Gin 
895 900 

ttt aac aag gcg att agt caa att caa gaa tea ctt 
Phe Asn Lyi Ala He sir Gin lie Gin Glu ser Leu 
910 915 92° 

act qca ttg ggc aag ctg caa gac gtt gtt aac cag 
Thr Ala Leu Gly Lys Leu Gin Asp Val val Asn Gin 
925 930 935 

tta aac aca ctt gtt aaa caa ctt age tct aat ttt 
Leu Asn Thr Leu val Lys Gin Leu ser ser Asn Phe 
945 950 

aqt gtg eta aat gat ate ctt teg ega ctt gat aaa 
ser Val Leu Asn Asp lie Leu Ser Arg Leu Asp Lys 
960 965 

gta caa att gac agg tta att aca ggc aga ctt caa 
val Gin lie Asp Arg Leu lie Thr Gly Arg Leu Gin 
975 980 

tat gta aca caa caa eta ate agg get get gaa ate 
Tyr val Thr Gin Gin Leu lie Arg Ala Ala Glu lie 
* 990 995 1000 

tct get aat ctt get get act aaa atg tct gag tgt gtt 
ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu cys Val 
1005 1° 10 101b 



caa gca 
Gin Ala 
940 

att tea 
lie ser 
955 

gcg gag 
Ala Glu 



caa acc 
Gin Thr 



rtt aaa caa tea aaa aga gtt gac ttt tgt gga aag ggc tac cac 
LeS a? 3S 12 Ss o A?g ?al ?s P Phe cys 5 Gly Lys G?y Tyr his q 



ctt atg tec ttc 
Leu Met Ser Phe 



cat gtc acg tat 
His val Thr Tyr 

cca gca att tgt 
pro Ala lie cys 



cca caa gca gec ccg cat ggt gtt gtc ttc eta 
Pro Gin Ala Ala Pro His G?y val val Phe Leu 
1035 1040 1045 

gtg cca tec cag gag agg aac ttc acc aca gcg 
VaT Pro Ser Gin Glu Arg Asn Phe Thr Thr Ala 
1050 1055 1060 

cat qaa ggc aaa gca tac ttc cct cgt gaa ggt 
Sis GlC Gly Lys Ala Tyr Phe Pro Arg Glu Gly 
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2560 



2608 



2656 



2704 



2752 



2800 



2848 



2896 



2944 



2992 



3040 



3088 



3133 



3178 



3223 



3268 



3313 
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S226CAS111.ST25 
1065 1070 1075 

8£i ?, tg t J t aat ggc a . ct tct tg 9 tt:t att aca cag agg aac 335R 
val Phe VaT Phe Asn G?y Thr Ser Trp Phe He Thr Gin Arg Asn 
1080 1085 1090 

££ c Su* J ct cca caa a J a att act aca gac aat aca ttt qtc tea 3403 
Phe Phe ser Pro Gin He He Thr Thr Asp Asn Thr Phe val ser 
1095 1100 1105 

gga aat tgt gat gtc gtt att ggc ate att aac aac aca gtt tat 3448 
GTy Asn cys Asp val val lie GTy lie lie Asn Asn Thr val Tyr 
111° 1115 1120 

f a £ ?1 9 5f a £ ct gag ctt gac tca ttc aaa gaa gag ctg gac 3493 
Asp Pro Leu Gin Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp 
1125 1130 1135 

aag tac ttc aaa aat cat aca tca cca gat gtt qat ctt aac aac 3«« 
Lys Tyr Phe Lys Asn His Thr ser Pro Asp val Asp Leu G?J A?p 8 
1140 1145 ' 2.150 

a T^ 5 ca 5? c a ? t aac flf* tct 9tc gtc aac att caa aaa qaa att 3583 
He ser cTy He A sn Ala ser Val Val Asn lie Gin Lys Glu lie 
II 55 1160 1165 

gac cgc etc aat gag gtc get aaa aat tta aat qaa tca etc att 3fi?R 
Asp Arg Leu Asn Glu val Ala Lys Asn Leu Asn Glu ier" LeS tie 
1170 1175 1180 

?!} £ aa 2? a ttg gga aaa tat gag caa tat att aaa tgg cct 3673 
Asp Leu Gin Glu Leu G Ty Lys Tyr Glu Gin Tyr lie Lys Trp Pro 
1185 1190 1195 

tgg tat gtt tgg etc gqc ttc att get gga eta att acc ate ate 37i« 
Trp Tyr Val Trp Leu Gly Phe He Ala GTy LeS ile Ala !le Val 3 18 

1200 1205 1210 

mo? Sin a ? c ? tg ctt tgt tgc atg act agt tgt tgc agt tgc 3763 
Met Val Thr He Leu Leu cys cys Met Thr ser cys Cys Ser cys 
1215 1220 1225 

etc aag ggt gca tgc tct tgt ggt tct tgc tgc aag ttt qat qaa 3808 
Leu Lys Gly Ala Cys ser cys Gly ser Cys cys Lys Phe A§p G?2 808 
1ZS0 1235 1240 

S S P C S 88 SS £5 5! BJ 8S 5S £2 5S & S? 

1245 1250 1255 

taaacgaact tatggatttg tttatgagat tttttactct tggatcaatt actgcacagc 3913 
cagtaaaaat tgacaatget tctcctgcaa gt 3945 

<210> 3<211> 1255<212> PRT<213> CORONAVIRUS<400> 3 

Met Phe He Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu 
X 5 10 15 

Asp Arg cys Thr Thr Phe Asp Asp val Gin Ala Pro Asn Tyr Thr Gin 
i0 25 30 

His Thr ser Ser Met Arg Gly val Tyr Tyr Pro Asp Glu He Phe Arq 
35 40 45 a 
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ser Asp Thr Leu Tyr Leu Thr Gin Asp Leu Phe Leu Pro Phe Tyr Ser 
50 55 oO 

Asn val Thr Gly Phe His Thr He Asn His Thr Phe Gly Asn Pro val 

lie Pro Phe Lys Asp Gly He Tyr Phe Ala Ala Thr Glu Lys ser Asn 
85 9° y:> 

val val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys ser Gin 
100 105 AJ - U 

ser val lie He lie Asn Asn ser Thr Asn Val Val lie Arg Ala cys 
115 120 125 

Asn Phe Glu Leu cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met 
130 135 140 

Gly Thr Gin Thr His Thr Met He Phe Asp Asn Ala Phe Asn cys Thr 
145 150 155 

Phe Glu Tyr lie Ser Asp Ala Phe Ser Leu Asp val Ser Glu Lys ser 
165 I 70 1/:> 

Gly Asn Phe Lys His Leu Arg Glu Phe val Phe Lys Asn Lys Asp Gly 
180 185 ->- yu 

Phe Leu Tyr val Tyr Lys Gly Tyr Gin Pro lie Asp Val val Arg Asp 
195 200 

Leu Pro ser Gly Phe Asn Thr Leu Lys Pro lie Phe Lys Leu Pro Leu 
210 215 220 

Gly He Asn lie Thr Asn Phe Arg Ala He Leu Thr Ala Phe ser Pro 
225 230 235 *w 

Ala Gin Asp He Trp Gly Thr ser Ala Ala Ala Tyr Phe Val Gly Tyr 
245 250 

Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr He 
260 265 2/0 

Thr Asp Ala val Asp cys ser Gin Asn Pro Leu Ala Glu Leu Lys Cys 

ser val Lys ser Phe Glu lie Asp Lys Gly He Tyr Gin Thr Ser Asn 
290 295 3UO 

Phe Arg val val Pro Ser Gly Asp val Val Arg Phe pro Asn lie Thr 
305 310 315 1<W 
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Asn Leu cys Pro Phe Gly Glu val phe Asn Ala Thr Lys Phe Pro ser 
325 330 335 

val Tyr Ala Trp Glu Arg Lys Lys He ser Asn cys val Ala Asp Tyr 
340 345 350 

Ser Val Leu Tyr Asn Ser Thr Phe Phe ser Thr phe Lys cys Tyr Gly 
355 360 365 

Val ser Ala Thr Lys Leu Asn Asp Leu Cys Phe ser Asn Val Tyr Ala 
370 375 380 

Asp Ser Phe Val val Lys Gly Asp Asp val Arg Gin lie Ala Pro Gly 
385 390 395 400 

Gin Thr Gly val lie Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe 
405 410 415 

Met Gly cys val Leu Ala Trp Asn Thr Arg Asn lie Asp Ala Thr Ser 
420 425 430 

Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu 
435 440 445 

Arg Pro Phe Glu Arg Asp lie Ser Asn Val Pro Phe Ser Pro Asp Gly 
450 455 460 

Lys Pro cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp 
465 470 475 480 

Tyr Gly Phe Tyr Thr Thr Thr Gly lie Gly Tyr Gin Pro Tyr Arq Val 
485 490 495 

Val val Leu ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly 
500 505 510 

Pro Lys Leu Ser Thr Asp Leu He Lys Asn Gin cys val Asn Phe Asn 
515 520 525 

Phe 530 L6U Gly 535 Gly Val LeU Thr 540 S6r Ser LyS Ar9 

Phe Gin Pro Phe Gin Gin Phe Gly Arg Asp val ser Asp Phe Thr Asp 
545 550 ~ 555 560 

Ser val Arg Asp Pro Lys Thr ser Glu lie Leu Asp He Ser Pro Cys 
565 570 575 

ser Phe Gly Gly val ser val lie Thr Pro Gly Thr Asn Ala Ser Ser 
580 585 590 
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Glu val Ala Val Leu Tyr Gin Asp Val Asn Cys Thr Asp Val ser Thr 
595 600 605 

Ala lie His Ala Asp Gin Leu Thr Pro Ala Trp Arg lie Tyr ser Thr 
610 615 620 

Gly Asn Asn Val Phe Gin Thr Gin Ala Gly Cys Leu He Gly Ala Glu 
625 630 635 640 

His Val Asp Thr Ser Tyr Glu cys Asp lie Pro lie Gly Ala Gly lie 
645 650 655 

Cys Ala ser Tyr His Thr val Ser Leu Leu Arg Ser Thr Ser Gin Lys 
660 665 670 

Ser lie Val Ala Tyr Thr Met ser Leu Gly Ala Asp Ser ser lie Ala 
675 680 685 

Tyr Ser Asn Asn Thr lie Ala lie Pro Thr Asn Phe Ser lie ser lie 
690 695 700 

Thr Thr Glu Val Met Pro val ser Met Ala Lys Thr ser val Asp Cys 
705 710 715 720 

Asn Met Tyr lie Cys Gly Asp ser Thr Glu Cys Ala Asn Leu Leu Leu 
725 730 735 

Gin Tyr Gly Ser Phe cys Thr Gin Leu Asn Arg Ala Leu ser Gly lie 
740 745 750 

Ala Ala Glu Gin Asp Arg Asn Thr Arg Glu val Phe Ala Gin val Lys 
755 760 765 

Gin Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe 
770 775 780 

ser Gin lie Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg ser Phe lie 
785 790 795 800 

Glu Asp Leu Leu Phe Asn Lys val Thr Leu Ala Asp Ala Gly Phe Met 
805 810 815 

Lys Gin Tyr Gly Glu cys Leu Gly Asp lie Asn Ala Arg Asp Leu lie 
820 825 830 

cys Ala Gin Lys Phe Asn Gly Leu Thr val Leu Pro Pro Leu Leu Thr 
835 840 845 

Asp Asp Met lie Ala Ala Tyr Thr Ala Ala Leu val Ser Gly Thr Ala 
850 855 860 
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Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gin lie Pro Phe 
865 870 875 880 

Ala Met Gin Met Ala Tyr Arg Phe Asn Gly lie Gly Val Thr Gin Asn 
885 890 895 

val Leu Tyr Glu Asn Gin Lys Gin lie Ala Asn Gin Phe Asn Lys Ala 
900 905 910 

lie ser Gin lie Gin Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly 
915 920 925 

Lys Leu Gin Asp Val val Asn Gin Asn Ala Gin Ala Leu Asn Thr Leu 
930 935 940 

Val Lys Gin Leu Ser Ser Asn Phe Gly Ala lie ser Ser val Leu Asn 
945 950 955 960 

Asp lie Leu Ser Arg Leu Asp Lys val Glu Ala Glu Val Gin lie Asp 
965 970 975 

Arg Leu lie Thr Gly Arg Leu Gin Ser Leu Gin Thr Tyr Val Thr Gin 
980 985 990 

Gin Leu He Arg Ala Ala Glu lie Arg Ala Ser Ala Asn Leu Ala Ala 
995 1000 ~ 1005 

Thr Lys Met ser Glu cys val Leu Gly Gin ser Lys Arg val Asp 
1010 1015 1020 

Phe cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gin Ala Ala 
1025 1030 1035 

Pro His Gly Val Val Phe Leu His Val Thr Tyr val Pro Ser Gin 
1040 1045 1050 

Glu Arg Asn Phe Thr Thr Ala Pro Ala lie Cys His Glu Gly Lys 
1055 1060 1065 

Ala Tyr Phe Pro Arg Glu Gly val Phe val Phe Asn Gly Thr ser 
1070 1075 1080 

Trp Phe lie Thr Gin Arg Asn Phe Phe Ser pro Gin lie lie Thr 
1085 1090 1095 

Thr Asp Asn Thr Phe val ser Gly Asn Cys Asp val Val xle Gly 
1100 1105 1110 

He lie Asn Asn Thr Val Tyr Asp Pro Leu Gin Pro Glu Leu Asp 
1115 1120 1125 
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Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser 
H30 1135 J- 140 

Pro Asp val Asp Leu Gly Asp He ser Gly He Asn Ala ser val 
1145 1150 

val Asn He Gin Lys Glu He Asp Arg Leu Asn Glu val Ala Lys 
1160 1165 1170 

Asn Leu Asn Glu ser Leu lie Asp Leu Gin Glu Leu Gly Lys Tyr 
1175 1180 

Glu Gin Tyr lie Lys Trp Pro Trp Tyr Val Trp Leu Gly Phe lie 
1190 1195 J.^uu 

Ala Gly Leu lie Ala He val Met Val Thr lie Leu Leu cys cys 
1205 1210 x^i3 

Met Thr ser Cys cys ser cys Leu Lys Gly Ala Cys Ser cys Gly 
1220 ' I 225 J-^aU 

ser cys cys Lys Phe Asp Glu Asp Asp ser Glu Pro val Leu Lys 
1235 1240 ±Z4> 

Gly val Lys Leu His Tyr Thr 
1250 1255 

<:210> 4<211> 3943<212> DNA<213> CORONAVIRUS<400> 4 

Jtcttctgga aaaaggtagg cttatcatta gagaaaacaa cagagttgtg gtttcaagtg 60 

atattcttgt taacaactaa acgaacatgt ttattttctt attatttctt actctcacta 120 

gtggtagtga ccttgaccgg tgcaccactt ttgatgatgt tcaagctcct aattacactc 180 

aacatacttc atctatgagg ggggtttact atcctgatga aatttttaga tcagacactc 240 

tttatttaac tcaggattta tttcttccat tttattctaa tgttacaggg tttcatacta 

ttaatcatac gtttggcaac cctgtcatac cttttaagga tggtatttat tttgctgcca 

cagagaaatc aaatgttgtc cgtggttggg tttttggttc taccatgaac aacaagtcac 420 

agtcggtgat tattattaac aattctacta atgttgttat acgagcatgt aactttgaat 

tgtgtgacaa ccctttcttt gctgtttcta aacccatggg tacacagaca catactatga 

tattcgataa tgcatttaat tgcactttcg agtacatatc tgatgccttt tcgcttgatg 

tttcagaaaa gtcaggtaat tttaaacact tacgagagtt tgtgtttaaa aataaagatg 

ggtttctcta tgtttataag ggctatcaac ctatagatgt agttcgtgat ctaccttctg 

gttttaacac tttgaaacct atttttaagt tgcctcttgg tattaacatt acaaatttta 

gagccattct tacagccttt tcacctgctc aagacatttg gggcacgtca gctgcagcct 

attttgttgg ctatttaaag ccaactacat ttatgctcaa gtatgatgaa aatggtacaa 
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360 



480 
540 
600 
660 
720 
780 
840 
900 
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tcacagatgc tgttgattgt tctcaaaatc cact^gctga Ictcaaatgc tctgttaaga 960 
gctttgagat tgacaaagga atttaccaga cctctaattt cagggttgtt ccctcaggag 1020 
atgttgtgag attccctaat attacaaact tgtgtccttt tggagaggtt tttaatgcta 1080 
ctaaattccc ttctgtctat gcatgggaga gaaaaaaaat ttctaattgt gttgctgatt 1140 
actctgtgct ctacaactca acattttttt caacctttaa gtgctatggc gtttctgcca 1200 
ctaagttgaa tgatctttgc ttctccaatg tctatgcaga ttcttttgta gtcaagggag 1260 
atgatgtaag acaaatagcg ccaggacaaa ctggtgttat tgctgattat aattataaat 1320 
tgccagatga tttcatgggt tgtgtccttg cttggaatac taggaacatt gatgctactt 1380 
caactggtaa ttataattat aaatataggt atcttagaca tggcaagctt aggccctttg 1440 
agagagacat atctaatgtg cctttctccc ctgatggcaa accttgcacc ccacctgctc 1500 
ttaattgtta ttggccatta aatgattatg gtttttacac cactactggc attggctacc 1560 
aaccttacag agttgtagta ctttcttttg aacttttaaa tgcaccggcc acggtttgtg 1620 
gaccaaaatt atccactgac cttattaaga accagtgtgt caattttaat tttaatggac 1680 
tcactggtac tggtgtgtta actccttctt caaagagatt tcaaccattt caacaatttg 1740 
gccgtgatgt ctctgatttc actgattccg ttcgagatcc taaaacatct gaaatattag 1800 
acatttcacc ttgctctttt gggggtgtaa gtgtaattac acctggaaca aatgcttcat i860 
ctgaagttgc tgttctatat caagatgtta actgcactga tgtttctaca gcaatccatg 1920 
cagatcaact cacaccagct tggcgcatat attctactgg aaacaatgta ttccagactc 1980 
aagcaggctg tcttatagga gctgagcatg tcgacacttc ttatgagtgc gacattccta 2040 
ttggagctgg catttgtgct agttaccata cagtttcttt attacgtagt actagccaaa 2100 
aatctattgt ggcttatact atgtctttag gtgctgatag ttcaattgct tactctaata 2160 
acaccattgc tatacctact aacttttcaa ttagcattac tacagaagta atgcctgttt 2220 
ctatggctaa aacctccgta gattgtaata tgtacatctg cggagattct actgaatgtg 2280 
ctaatttgct tctccaatat ggtagctttt gcacacaact aaatcgtgca ctctcaggta 2340 
ttgctgctga acaggatcgc aacacacgtg aagtgttcgc tcaagtcaaa caaatgtaca 2400 
aaaccccaac tttgaaatat tttggtggtt ttaatttttc acaaatatta cctgaccctc 2460 
taaagccaac taagaggtct tttattgagg acttgctctt taataaggtg acactcgctg 2520 
atgctggctt catgaagcaa tatggcgaat gcctaggtga tattaatgct agagatctca 2580 
tttgtgcgca gaagttcaat gggcttacag tgttgccacc tctgctcact gatgatatga 2640 
ttgctgccta cactgctgct ctagttagtg gtactgccac tgctggatgg acatttggtg 2700 
ctggcgctgc tcttcaaata ccttttgcta tgcaaatggc atataggttc aatggcattg 2760 
gagttaccca aaatgttctc tatgagaacc aaaaacaaat cgccaaccaa tttaacaagg 2820 
cgattagtca aattcaagaa tcacttacaa caacatcaac tgcattgggc aagctgcaag 2880 
acgttgttaa ccagaatgct caagcattaa acacacttgt taaacaactt agctctaatt 2940 
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ttggtgcaat 


ttcaagtgtg 


ctaaatgata 


S226CAS111. 
tcctttcgcg 


ST25 

acttgataaa 


gtcgaggcgg 


3000 


aggtacaaat 


tgacaggcta 


attacaggca 


gacttcaaag 


ccttcaaacc 


tatgtaacac 


3060 


aacaactaat 


cagggctgct 


gaaatcaggg 


cttctgctaa 


tcttgctgct 


actaaaatgt 


3120 


ctgagtgtgt 


tcttggacaa 


tcaaaaagag 


ttgacttttg 


tggaaagggc 


taccacctta 


3180 


tgtccttccc 


acaagcagcc 


ccgcatggtg 


ttgtcttcct 


acatgtcacg 


tatgtgccat 


3240 


cccaggagag 


gaacttcacc 


acagcgccag 


caatttgtca 


tgaaggcaaa 


gcatacttcc 


3300 


ctcgtgaagg 


tgtttttgtg 


tttaatggca 


cttcttggtt 


tattacacag 


aggaacttct 


3360 


tttctccaca 


aatraattact 


acagacaata 


catttgtctc 


aggaaattgt 


gatgtcgtta 


3420 


ttggcatcat 


taacaacaca 


gtttatgatc 


ctctgcaacc 


tgagcttgac 


tcattcaaag 


3480 


aagagctgga 


caagtacttc 


aaaaatcata 


catcaccaga 


tgttgatctt 


ggcgacattt 


3540 


caggcattaa 


cgcttctgtc 


gtcaacattc 


aaaaagaaat 


tgaccgcctc 


aatgaggtcg 


3600 


ctaaaaattt 


aaatgaatca 


ctcattgacc 


ttcaagaatt 


gggaaaatat 


gagcaatata 


3660 


ttaaatggcc 


ttggtatgtt 


tggctcggct 


tcattgctgg 


actaattgcc 


atcgtcatgg 


3720 


ttacaatctt 


gctttgttgc 


atgactagtt 


gttgcagttg 


cctcaagggt 


gcatgctctt 


3780 


gtggttcttg 


ctgcaagtrtt 


gatgaggatg 


actctgagcc 


agttctcaag 


ggtgtcaaat 


3840 


tacattacac 


ataaacgaac 


ttatggattt 


gtttatgaga 


ttttttactc 


ttggatcaat 


3900 


tactgcacag 


ccagtaaaaa 


ttgacaatgc 


ttctcctgca 


agt 




3943 


<210> 5<211> 2049<212> DNA<213> COR0NAVIRUS<400> I 
ctcttctgga aaaaggtagg cttatcatta gagaaaacaa cagagttgtg 


gtttcaagtg 


60 


atattctrtgt 


taacaactaa 


acgaacatgt 


ttattttctt 


attatttctt 


actctcacta 


120 


gtggtagtga 


ccttgaccgg 


tgcaccactt 


ttgatgatgt 


tcaagctcct 


aattacactc 


180 


aacatacttc 


atctatgagg 


ggggtttact 


atcctgatga 


aatttttaga 


tcagacactc 


240 


tttatttaac 


tcaggattta 


tttcttccat 


tttattctaa 


tgttacaggg 


tttcatacta 


300 


ttaatcatac 


gtttggcaac 


cctgtrcatac 


cttttaagga 


tggtatttat 


tttgctgcca 


360 


cagagaaatc 


aaangttgtc 


cgtggttggg 


ttnttggttc 


taccatgaac 


aacaagtcac 


420 


agtcggtgat 


tatnattaac 


aattctacta 


atgttgttat 


acgagcatgt 


aactttgaat 


480 


tgtgtgacaa 


ccctttcttt 


gctgtttcta 


aacccatggg 


tacacagaca 


catactatga 


540 


tattcgataa 


tgcatttaat 


tgcactttcg 


agtacatatc 


tgatgccttt 


tcgcttgatg 


600 


tttcagaaaa 


gtcaggtaat 


tttaaacact 


tacgagagtt 


tgtgtttaaa 


aataaagatg 


660 


ggtttctcta 


tgtttataag 


ggctatcaac 


ctatagatgt 


agttcgtgat 


ctaccttctg 


720 


gttttaacac 


tttgaaacct 


atttttaagt 


tgcctcttgg 


tattaacatt 


acaaatttta 


780 


gagccattct 


tacagccttt 


tcacctgctc 


aagacatttg 


gggcacgtca 


gctgcagcct 


840 


attttgttgg 


ctatttaaag 


ccaactacat 


ttatgctcaa 


gtatgatgaa 


aatggtacaa 


900 


tcacagatgc 


tgttgattgt 


tctcaaaatc 


cacttgctga 
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tctgttaaga 


960 
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gctttgagat tgacaaagga atttaccaga cctctaattt cagggttgtt ccctcaggag 1020 
atgttgtgag attccctaat attacaaact tgtgtccttt tggagaggtt tttaatgcta 1080 
ctaaattccc ttctgtctat gcatgggaga gaaaaaaaat ttctaattgt gttgctgatt 1140 

actctgtgct ctacaactca acattttttt caacctttaa gtgctatggc gtttctgcca 1200 

ctaagttgaa tgatctttgc ttctccaatg tctatgcaga ttcttttgta gtcaagggag 1260 

atgatgtaag acaaatagcg ccaggacaaa ctggtgttat tgctgattat aattataaat 1320 

tgccagatga tttcatgggt tgtgtccttg cttggaatac taggaacatt gatgctactt 1380 

caactggtaa ttataattat aaatataggt atcttagaca tggcaagctt aggccctttg 1440 

agagagacat atctaatgtg cctttctccc ctgatggcaa accttgcacc ccacctgctc 1500 

ttaattgtta ttggccatta aatgattatg gtttttacac cactactggc attggctacc 1560 

aaccttacag agttgtagta ctttcttttg aacttttaaa tgcaccggcc acggtttgtg 1620 

gaccaaaatt atccactgac cttattaaga accagtgtgt caattttaat tttaatggac 1680 

tcactggtac tggtgtgtta actccttctt caaagagatt tcaaccattt caacaatttg 1740 

gccgtgatgt ctctgatttc actgattccg ttcgagatcc traaaacatct gaaatattag 1800 

acatttcacc ttgctctttt gggggtgtaa gtgtaattac acctggaaca aatgcttcat 1860 

ctgaagttgc tgttctatat caagatgtta actgcactga tgtttctaca gcaatccatg 1920 

cagatcaact cacaccagct tggcgcatat attctactgg aaacaatgta ttccagactc 1980 

aagcaggctg tcttatagga gctgagcatg tcgacacttc ttatgagtgc gacattccta 2040 

ttggagctg 2Q49 

<210> 6<211> 2027<212> DNA<213> CORONAVIRUS<400> 6 

catgcagatc aactcacacc agcttggcgc atatattcta ctggaaacaa tgtattccag 60 

actcaagcag gctgtcttat aggagctgag catgtcgaca cttcttatga gtgcgacatt 120 

cctattggag ctggcatttg tgctagttac catacagttt ctttattacg tagtactagc 180 

caaaaatcta ttgtggctta tactatgtct ttaggtgctg atagttcaat tgcttactct 240 

aataacacca ttgctatacc tactaacttt tcaattagca ttactacaga agtaatgcct 300 

gtttctatgg ctaaaacctc cgtagattgt aatatgtaca tctgcggaga ttctactgaa 360 

tgtgctaatt tgcttctcca atatggtagc ttttgcacac aactaaatcg tgcactctca 420 

ggtattgctg ctgaacagga tcgcaacaca cgtgaagtgt tcgctcaagt caaacaaatg 480 

tacaaaaccc caactttgaa atattttggt ggttttaatt tttcacaaat attacctgac 540 

cctctaaagc caactaagag gtcttttatt gaggacttgc tctttaataa ggtgacactc 600 

gctgatgctg gcttcatgaa gcaatatggc gaatgcctag gtgatattaa tgctagagat 660 

ctcatttgtg cgcagaagtt caatgggctt acagtgttgc cacctctgct cactgatgat 720 

atgattgctg cctacactgc tgctctagtt agtggtactg ccactgctgg atggacattt 780 

ggtgctggcg ctgctcttca aatacctttt gctatgcaaa tggcatatag gttcaatggc 840 
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attggagtta 


cccaaaatgt 


tctctatgag 
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aaccaaaaac aaatcgccaa 


ccaatttaac 


900 


aaggcgatta 


gtcaaattca 


agaatcactt 


acaacaacat 


caactgcatt 


gggcaagctg 


960 


caagacgttg 


ttaaccagaa 


tgctcaagca 


ttaaacacac 


ttgttaaaca 


acttagctct 


1020 


aattttggtg 


caatttcaag 


tgtgctaaat 


gatatccttt 


cgcgacttga 


taaagtcgag 


1080 


gcggaggtac 


aaattgacag 


gttaattaca 


ggcagacttc 


aaagccttca 


aacctatgta 


1140 


acacaacaac 


taatcagggc 


tgctgaaatc 


agggcttctg 


ctaatcttgc 


tgctactaaa 


1200 


atgtctgagt 


gtgttcttgg 


acaatcaaaa 


agagttgact 


tttgtggaaa 


gggctaccac 


1260 


cttatgtcct 


tcccacaagc 


agccccgcat 


ggtgttgtct 


tcctacatgt 


cacgtatgtg 


1320 


ccatcccagg 


agaggaactt 


caccacagcg 


ccagcaattt 


gtcatgaagg 


caaagcatac 


1380 


ttccctcgtg 


aaggtgtttt 


tgtgtttaat 


ggcacttctt 


ggtttattac 


acagaggaac 


1440 


ttcttttctc 


cacaaataat 


tactacagac 


aatacatttg 


tctcaggaaa 


ttgtgatgtc 


1500 


gttattggcg 


tcattaacaa 


cacagtttat 


gatcctctgc 


aacctgagct 


tgactcattc 


1560 


aaagaagagc 


tggacaagta 


cttcaaaaat 


catacatcac 


cagatgttga 


tcttggcgac 


1620 


atttcaggca 


ttaacgcttc 


tgtcgtcaac 


attcaaaaag 


aaattgaccg 


cctcaatgag 


1680 


gtcgctaaaa 


atttaaatga 


atcactcatt 


a a c "t*f tk a n 

yuV,*- *- l_ \_ ci y 


<x<x i_ y vj y cx cx d 


atatgagcaa 


1740 


tatattaaat 


ggccttggta 


tgtttggctc 


ggcttcattg 


ctggactaat 


tgccatcgtc 


1800 


atggttacaa 


tcttgctttg 


ttgcatgact 


agttgttgca 


gttgcctcaa 


gggtgcatgc 


1860 


tcttgtggtt 


cttgctgcaa 


gtttgatgag 


gatgactctg 


agccagttct 


caagggtgtc 


1920 


aaattacatt 


acacataaac 


gaacttatgg 


atttgtttat 


gagatttttt 


actcttggat 


1980 


caattactgc 


acagccagta 


aaaattgaca 


atgcttctcc 


tgcaagt 




2027 


<210> 7<211> 1096<212> DNA<213> CORONAVIRUS<400> 7 
tcttgctttg ttgcatgact agttgttgca gttgcctcaa gggtgcatgc tcttgtggtt 


60 


cttgctgcaa 


gtttgatgag 


gatgactctg 


agccagttct 


caagggtgtc aaattacatt 


120 


acacataaac 


gaacttatgg 


atttgtttat 


gagatttttt 


actcttggat 


caattactgc 


180 


acagccagta 


aaaattgaca 


atgcttctcc 


tgcaagtact 


gttcatgcta 


cagcaacgat 


240 


accgctacaa 


gcctcactcc 


ctttcggatg 


gcttgttatt 


ggcgttgcat 


ttcttgctgt 


300 


ttttcagagc 


gctaccaaaa 


taattgcgct 


caataaaaga 


tggcagctag 


ccctttataa 


360 


gggcttccag 


ttcatttgca 


atttactgct 


gctatttgtt 


accatctatt 


cacatctttt 


420 


gcttgtcgct 


gcaggtatgg 


aggcgcaatt 


tttgtacctc 


tatgccttga tatattttct 


480 


acaatgcatc 


aacgcatgta 


gaattattat 


gagatgttgg 


ctttgttgga agtgcaaatc 




caagaaccca 


ttactttatg 


atgccaacta 


ctttgtttgc 


tggcacacac ataactatga 


600 


ctactgtata 


ccatataaca 


gtgtcacaga 


tacaattgtc 


gttactgaag 


gtgacggcat 


660 


ttcaacacca 


aaactcaaag 


aagactacca 


aattggtggt 


tattctgagg ataggcactc 


720 


aggtgttaaa 


gactatgtcg 


ttgtacatgg 


ctatttcacc 


gaagtttact 


accagcttga 


780 
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gtctacacaa attactacag acactggtat tgaaaatgct acattcttca tctttaacaa 840 

gcttgttaaa gacccaccga atgtgcaaat acacacaatc gacggctctt caggagttgc 900 

taatccagca atggatccaa tttatgatga gccgacgacg actactagcg tgcctttgta 960 

agcacaagaa agtgagtacg aacttatgta ctcattcgtt tcggaagaaa caggtacgtt 1020 

aatagttaat agcgtacttc tttttcttgc tttcgtggta ttcttgctag tcacactagc 1080 

catccttact gcgctt log6 

<210> 8<211> 1135<212> DNA<213> CORONAVIRUS<400> 8 

attgccatcg tcatggttac aatcttgctt tgttgcatga ctagttgttg cagttgcctc 60 

aagggtgcat gctcttgtgg ttcttgctgc aagtttgatg aggatgactc tgagccagtt 120 

ctcaagggtg tcaaattaca ttacacataa acgaacttat ggatttgttt atgagatttt 180 

ttactcttgg atcaattact gcacagccag taaaaattga caatgcttct cctgcaagta 240 

ctgttcatgc tacagcaacg ataccgctac aagcctcact ccctttcgga tggcttgtta 300 

ttggcgttgc atttcttgct gtttttcaga gcgctaccaa aataattgcg ctcaataaaa 360 

gatggcagct agccctttat aagggcttcc agttcatttg caatttactg ctgctatttg 420 

ttaccatcta ttcacatctt ttgcttgtcg ctgcaggtat ggaggcgcaa tttttgtacc 480 

tctatgcctt gatatatttt ctacaatgca tcaacgcatg tagaattatt atgagatgtt 540 

ggctttgttg gaagtgcaaa tccaagaacc cattacttta tgatgccaac tactttgttt 600 

gctggcacac acataactat gactactgta taccatataa cagtgtcaca gatacaattg 660 

tcgttactga aggtgacggc atttcaacac caaaactcaa agaagactac caaattggtg 720 

gttattctga ggataggcac tcaggtgtta aagactatgt cgttgtacat ggctatttca 780 

ccgaagttta ctaccagctt gagtctacac aaattactac agacactggt attgaaaatg 840 

ctacattctt catctttaac aagcttgtta aagacccacc gaatgtgcaa atacacacaa 900 

tcgacggctc ttcaggagtt gctaatccag caatggatcc aatttatgat gagccgacga 960 

cgactactag cgtgcctttg taagcacaag aaagtgagta cgaacttatg tactcattcg 1020 

tttcggaaga aacaggtacg ttaatagtta atagcgtact tctttttctt gctttcgtgg 1080 

tattcttgct agtcacacta gccatcctta ctgcgcttcg attgtgtgcg tactg 1135 

C137)..(958)^223? 96<212> DNA<213> CORONAVIRUS<220><221> CDS<222> 
<400> 9 

tcttgctttg ttgcatgact agttgttgca gttgcctcaa gggtgcatgc tcttgtggtt 60 

cttgctgcaa gtttgatgag gatgactctg agccagttct caagggtgtc aaattacatt 120 

acacataaac gaactt atg gat ttg ttt atg aga ttt ttt act ctt gga tea 172 

Met Asp Leu Phe Met Arg phe Phe Thr Leu gTv ser 
1 5 10 

^u 1 ?? a S? 9 cca gta aaa att 9ac aat get tct cct gca agt act 220 
He Thr Ala Gin Pro Val Lys lie Asp Asn Ala ser Pro Ala sir Thr 
1j 20 25 
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33 SG 2B 3? JR 3? IB S3 S 35 SB£ 2? S 25 22 S3 

30 35 

S? £2 83 ST. 85 33 23 ffi 25 2B f 35 SB SS 23 3? 

45 50 

s is ir c ?3 ss 2s s s ss as 22 23 22 35 g §3 

SS a§ 22 IB i S5 S 22 22 22 35 f3 IB 35 SS 

80 " 

SB £S 22 25 32 22 23 13 SS? §?2 23 SB 52 552 5? 25 

95 100 XVJ 

35 2S 22 SS 3? 25 SS §3 532 IB 23 23 gl 2?? SB IB 

110 115 x u 

SS 2?? 35 32 25 35 32 Si 525 Si S 32 23 SS 22 25 

125 "0 X5;> 

35 SS 22 23 33 25 33 3s 32 53 3? S3 23 35 2J 3? 
35 IS 22 35 23 125 33 12 225 33 IB 33 33 35 fi! 23 



160 



gac ggc att tea aca cca aaa etc aaa gaa gac tac caa att ggt ggt 
Asp cfy lie ser Thr Pro Lys Leu Lys Glu Asp Tyr Gin lie Gty Giy 
175 180 

35 25 212 23 222 S3 12 IB S3 23 23 §5 33 S3 35? SB 

190 195 ^ 

H$ 35 22 32 23 32 53 32 SIS 22 13 SS 3? SR IB 32 

205 210 215 " u 

IS? 212 12 23 IB 212 22 2B IS? 22 22 IB 25 222 221 25 
33 K 22 22 32 22 33 SB IS S3 3? IB 222 f o 25 2? 

240 245 " u 

85 33 2B 22 S3 23 S3 22 22 IB 35 22 fffl SS 3? 3? 

255 260 ^ OJ 

act act age gtg cct ttg taagcacaag aaagtgagta cgaacttatg 
Thr Thr Ser Val Pro Leu 
270 

tactcattcg ttteggaaga aacaggtacg ttaatagtta atagegtact tctttttctt 

gctttcgtgg tattcttget agtcacacta gccatcctta ctgegett 
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508 
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700 " 
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796 
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<210> 10<211> 274<212> PRT<213> CORONAVIRUS<400> 10 

Met Asp Leu Phe Met Arg Phe Phe Thr Leu Gly ser lie Thr Ala Gin 
1 5 10 15 

pro Val Lys He Asp Asn Ala ser pro Ala ser Thr val His Ala Thr 
20 25 30 

Ala Thr lie Pro Leu Gin Ala Ser Leu Pro Phe Gly Trp Leu val lie 
35 40 45 

Gly val Ala Phe Leu Ala val Phe Gin ser Ala Thr Lys He lie Ala 
50 55 60 

Leu Asn Lys Arg Trp Gin Leu Ala Leu Tyr Lys Gly Phe Gin Phe lie 
65 70 75 80 

Cys Asn Leu Leu Leu Leu Phe Val Thr lie Tyr ser His Leu Leu Leu 
85 90 95 

val Ala Ala Gly Met Glu Ala Gin Phe Leu Tyr Leu Tyr Ala Leu lie 
100 105 110 

Tyr Phe Leu Gin Cys lie Asn Ala Cys Arg lie lie Met Arg Cys Trp 
115 120 125 

Leu Cys Trp Lys Cys Lys Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn 
130 135 140 

Tyr Phe Val cys Trp His Thr His Asn Tyr Asp Tyr Cys lie Pro Tyr 
145 150 155 160 

Asn Ser val Thr Asp Thr lie Val val Thr Glu Gly Asp Gly lie Ser 
165 170 ' 175 

Thr Pro Lys Leu Lys Glu Asp Tyr Gin lie Gly Gly Tyr Ser Glu Asp 
180 185 190 

Arg His Ser Gly Val Lys Asp Tyr val Val Val His Gly Tyr Phe Thr 
195 200 205 

Glu val Tyr Tyr Gin Leu Glu Ser Thr Gin lie Thr Thr Asp Thr Gly 
210 215 220 

lie Glu Asn Ala Thr Phe Phe lie Phe Asn Lys Leu Val Lys Asp Pro 
225 230 235 240 

Pro Asn val Gin lie His Thr lie Asp Gly ser ser Gly val Ala Asn 
245 250 255 
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Pro Ala Met Asp Pro He Tyr Asp Glu Pro Thr Thr Thr Thr ser Val 
260 265 270 



Pro Leu 



<210> 11<211> 1096<212> DNA<213> CORONAVIRUS<220><221> CDS<222> 
C558)..C1019)<223> 



<400> 11 
tcttgctttg 


ttgcatgact 


agttgttgca 


gttgcctcaa 


gggtgcatgc 


tcttgtggtt 


60 


cttgctgcaa 


gtttgatgag 


gatgactctg 


agecagttet 


caagggtgtc 


aaattacatt 


120 


acacataaac 


gaacttatgg 


atttgtttat 


gagatttttt 


actcttggat 


caattactgc 


180 


acagccagta 


aaaattgaca 


atgcttctcc 


tgcaagtact 


gttcatgeta 


cagcaacgat 


240 


accgctacaa 


gcctcactcc 


ettteggatg 


gcttgttatt 


ggcgttgcat 


ttcttgctgt 


300 


ttttcagagc 


gctaccaaaa 


taattgeget 


caataaaaga 


tggcagctag 


ccctttataa 


360 


gggcttccag 


ttcatttgca 


atttactget 


gctatttgtt 


accatctatt 


cacatctttt 


420 


gcttgtcgct 


gcaggtatgg 


aggegcaatt 


tttgtacctc 


tatgecttga 


tatattttct 


480 


acaatgcatc 


aacgcatgta 


gaattattat 


gagatgttgg 


ctttgttgga 


agtgcaaatc 


540 


caagaaccca 


ttacttt atg atg cca act act ttg ttt get ggc 
Met Met Pro Thr Thr Leu Phe Ala Gly 
1 5 


aca cac 
Thr His 
10 


590 



ata act atg act act gta tac cat ata aca gtg tea cag ata caa ttg 638 
lie Thr Met Thr Thr Val Tyr His lie Thr val Ser Gin lie Gin Leu 
15 20 25 



teg tta ctg aag gtg acg gca ttt caa cac caa aac tea aag aag act 686 
Ser Leu Leu Lys Val Thr Ala Phe Gin His Gin Asn ser Lys Lys Thr 
30 35 40 

ace aaa ttg gtg gtt att ctg agg ata ggc act cag gtg tta aag act 734 
Thr Lys Leu val val lie Leu Arg lie Gly Thr Gin Val Leu Lys Thr 
45 50 55 

atg teg ttg tac atg get att tea ccg aag ttt act acc age ttg agt 782 
Met Ser Leu Tyr Met Ala lie ser Pro Lys Phe Thr Thr ser Leu ser 
60 65 70 75 

eta cac aaa tta eta cag aca ctg gta ttg aaa atg eta cat tct tea 830 
Leu His Lys Leu Leu Gin Thr Leu val Leu Lys Met Leu His Ser Ser 
80 85 90 

tct tta aca age ttg tta aag acc cac cga atg tgc aaa tac aca caa 878 
Ser Leu Thr Ser Leu Leu Lys Thr His Arg Met Cys Lys Tyr Thr Gin 
95 100 ~ 105 

teg acg get ctt cag gag ttg eta ate cag caa tgg ate caa ttt atg 926 
Ser Thr Ala Leu Gin Glu Leu Leu lie Gin Gin Trp lie Gin Phe Met 
110 115 120 

atg age cga cga cga eta eta gcg tgc ctt tgt aag cac aag aaa gtg 974 
Met ser Arg Arg Arg Leu Leu Ala Cys Leu Cys Lys His Lys Lys Val 
125 130 135 

agt acg aac tta tgt act cat teg ttt egg aag aaa cag gta cgt 1019 
Ser Thr Asn Leu cys Thr His ser Phe Arg Lys Lys Gin val Arg 
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140 145 150 

taatagttaa tagcgtactt ctttttcttg ctttcgtggt attcttgcta gtcacactag 1079 
ccatccttac tgcgctt 1096 

<210> 12<211> 154<212> PRT<213> CORONAVIRUS<400> 12 

Met Met Pro Thr Thr Leu Phe Ala Gly Thr His lie Thr Met Thr Thr 
15 10 15 

Val Tyr His lie Thr Val Ser Gin lie Gin Leu Ser Leu Leu Lys Val 
20 25 30 

Thr Ala Phe Gin His Gin Asn ser Lys Lys Thr Thr Lys Leu val val 
35 40 45 

lie Leu Arg lie Gly Thr Gin Val Leu Lys Thr Met ser Leu Tyr Met 
50 55 60 

Ala lie Ser Pro Lys Phe Thr Thr Ser Leu Ser Leu His Lys Leu Leu 
65 70 75 80 

-» 

Gin Thr Leu val Leu Lys Met Leu His Ser Ser Ser Leu Thr ser Leu 
85 90 95 

Leu Lys Thr His Arg Met Cys Lys Tyr Thr Gin Ser Thr Ala Leu Gin 
100 105 110 

Glu Leu Leu lie Gin Gin Trp lie Gin Phe Met Met Ser Arg Arg Arg 
115 120 125 

Leu Leu Ala Cys Leu Cys Lys His Lys Lys val Ser Thr Asn Leu cys 
130 135 140 

Thr His Ser Phe Arg Lys Lys Gin Val Arg 
145 150 

<210> 13<211> 332<212> DNA<213> CORONAVIRUS<220><221> CDS<222> 
(36)..(263)<223> 

<400> 13 

tgcctttgta agcacaagaa agtgagtacg aactt atg tac tea ttc gtt teg 53 

Met Tyr Ser Phe val Ser 
1 5 



gaa gaa aca gqt acg tta ata gtt aat age gta ctt ctt ttt ctt get 
Glu Glu Thr Gly Thr Leu lie val Asn ser Val Leu Leu Phe Leu Ala 
10 15 20 



101 



ttc gtg gta ttc ttg eta gtc aca eta gee ate ctt act gcg ctt cga 149 

Phe Val Val Phe Leu Leu val Thr Leu Ala lie Leu Thr Ala Leu Arg 

25 30 35 

ttg tgt gcg tac tgc tgc aat att gtt aac gtg agt tta gta aaa cca 197 

Leu Cys Ala Tyr Cys Cys Asn lie Val Asn Val ser Leu val Lys Pro 
40 45 50 
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acg gtt tac gtc tac teg cgt gtt aaa aat ctg aac tct tct gaa gqa 245 
Thr val Tyr val Tyr Ser Arg val Lys Asn Leu Asn ser Ser Glu Gly 
55 60 65 70 

gtt cct gat ctt ctg gtc taaacgaact aactattatt attattctgt 293 
val Pro Asp Leu Leu val 
75 

ttggaacttt aacattgett atcatggcag acaaeggta 332 

<210> 14<211> 76<212> PRT<213> CORONAVIRUS<400> 14 

Met Tyr ser Phe Val ser Glu Glu Thr Gly Thr Leu lie Val Asn Ser 
15 10 15 

val Leu Leu Phe Leu Ala Phe val Val Phe Leu Leu Val Thr Leu Ala 
20 25 30 

lie Leu Thr Ala Leu Arg Leu cys Ala Tyr Cys Cys Asn lie Val Asn 
35 40 45 

Val ser Leu Val Lys Pro Thr val Tyr Val Tyr Ser Arg val Lys Asn 
50 55 60 

Leu Asn Ser Ser Glu Gly val Pro Asp Leu Leu val 
65 70 75 

<210> 15<211> 332<212> DNA<213> CORONAVIRUS<400> 15' 

tgcctttgta agcacaagaa agtgagtacg aacttatgta etcattegtt teggaagaaa 60 

caggtaegtt aatagttaat agegtactte tttttcttgc tttcgtggta ttcttgetag 120 

tcacactagc catccttact gegcttcgat tgtgtgcgta ctgctgcaat attgttaacg 180 

tgagtttagt aaaaccaacg gtttaegtet actcgcgtgt taaaaatctg aactcttctg 240 

aaggagttcc tgatcttctg gtctaaacga actaactatt attattattc tgtttggaac 300 

tttaacattg cttatcatgg cagacaaegg ta 332 

<210> 16<211> 708<212> DNA<213> CORONAVIRUS<220><221> CDS<222> 
(41)..(703)<223> 

<400> 16 

tattattatt attctgtttg gaactttaac attgettate atg gca gac aac ggt 55 

Met Ala Asp Asn Gly 
1 5 

act att acc gtt gag gag ctt aaa caa etc ctg gaa caa tgg aac eta 103 

Thr lie Thr val Glu Glu Leu Lys Gin Leu Leu Glu Gin Trp Asn Leu 
10 15 20 

gta ata ggt ttc eta ttc eta gec tgg att atg tta eta caa ttt gec 151 
val lie Gly Phe Leu Phe Leu Ala Trp lie Met Leu Leu Gin Phe Ala 
25 30 35 

tat tct aat egg aac agg ttt ttg tac ata ata aag ctt gtt ttc etc 199 
Tyr ser Asn Arg Asn Arg Phe Leu Tyr He lie Lys Leu val Phe Leu 
40 45 50 
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tag etc ttg tgg cca gta aca ctt get tgt ttt gtg ctt get get gtc 

Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe Val Leu Ala Ala Val 

55 60 65 

tac aga att aat tgg gtg act ggc ggg att gcg att gca atg get tgt 

Tyr Arg He Asn Trp vaT Thr Gly Gly lie Ala He Ala Met Ala Cys 
70 75 80 85 

att gta ggc ttg atg tgg ctt age tac ttc gtt get tec ttc agg ctg 

lie val Gly Leu Met Trp Leu Ser Tyr Phe Val Ala Ser Phe Arg Leu 
90 95 100 



atg gee gga cac tec eta ggg cgc tgt gac att aag gac ctg cca aaa 

Met Ala Gly His Ser Leu Gly Arg Cys Asp lie Lys Asp Leu Pro Lys 

150 155 160 165 

gag ate act gtg get aca tea cga acg ctt tct tat tac aaa tta gga 

Glu lie Thr val Ala Thr Ser Arg Thr Leu Ser Tyr Tyr Lys Leu Gly 

170 175 180 

gcg teg cag cgt gta ggc act gat tea ggt ttt get gca tac aac cgc 

Ala ser Gin Arg val Gly Thr Asp Ser Gly Phe Ala Ala Tyr Asn Arg 

185 190 195 



247 



295 



343 



ttt get cgt acc cgc tea atg tgg tea ttc aac cca gaa aca aac att 391 

Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn Pro Glu Thr Asn lie 

105 110 115 

ctt etc aat gtg cct etc egg ggg aca att gtg acc aga ccg etc atg 439 

Leu Leu Asn val Pro Leu Arg Gly Thr lie Val Thr Arg Pro Leu Met 

120 125 130 

gaa agt gaa ctt gtc att ggt get gtg ate att cgt ggt cac ttg cga 487 

Glu ser Glu Leu Val He Gly Ala vaT lie lie Arg Gly His Leu Arg 

135 140 145 



535 



583 



631 



tac cgt att gga aac tat aaa tta aat aca gac cac gee ggt age aac 679 
Tyr Arg lie Gly Asn Tyr Lys Leu Asn Thr Asp His Ala Gly Ser Asn 
200 205 210 

gac aat att get ttg eta gta cag taagt 708 
Asp Asn lie Ala Leu Leu Val Gin 
215 220 

<210> 17<211> 221<212> PRT<213> CORONAVIRUS<400> 17 

Met Ala Asp Asn Gly Thr lie Thr Val Glu Glu Leu Lys Gin Leu Leu 
15 10 15 

Glu Gin Trp Asn Leu val lie Gly Phe Leu Phe Leu Ala Trp lie Met 
20 25 30 

Leu Leu Gin Phe Ala Tyr Ser Asn Arg Asn Arg Phe Leu Tyr lie lie 
35 40 45 

Lys Leu Val Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala cys Phe 
50 55 60 

Val Leu Ala Ala val Tyr Arg lie Asn Trp Val Thr Gly Gly lie Ala 
65 70 75 80 



lie Ala Met Ala Cys lie Val Gly Leu Met Trp Leu ser Tyr Phe val 
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85 90 95 

Ala ser Phe Arg Leu Phe Ala Arg Thr Arg ser Met Trp ser Phe Asn 
100 105 iX 

Pro Glu Thr Asn He Leu Leu Asn Val Pro Leu Arg Gly Thr lie val 
115 120 

Thr Arg Pro Leu Met Glu Ser Glu Leu Val lie Gly Ala val lie lie 
130 135 1 u 

Arg Gly His Leu Arg Met Ala Gly His ser Leu Gly Arg Cys Asp lie 



145 



L ys Asp Leu Pro Lys Glu lie Thr Val Ala Thr ser Arg Thr Leu Ser 

Tyr Tyr Lys Leu Gly Ala Ser Gin Arg val Gly Thr Asp ser Gly Phe 
180 185 xyu 

Ala Ala Tyr Asn Arg Tyr Arg lie Gly Asn Tyr Lys Leu Asn Thr Asp 
195 200 ^v-* 

His Ala Gly ser Asn Asp Asn lie Ala Leu Leu val Gin 
210 215 220 

^KK 1?U711> 769<212> DNA<213> CORONAVIRUS<400> 18 
S^gatcSc tg^trtSac gaactaacta ttattattat tctgtttgga actttaacat 60 

tgcttatcat ggcagacaac ggtactatta ccgttgagga gcttaaacaa ctcctggaac 

aatggaacct agtaataggt ttcctattcc tagcctggat tatgttacta caatttgcct 

attctaatcg gaacaggttt ttgtacataa taaagcttgt tttcctctgg ctcttgtggc 

cagtaacact tgcttgtttt gtgcttgctg ctgtctacag aattaattgg gtgactggcg 

ggattgcgat tgcaatggct tgtattgtag gcttgatgtg gcttagctac ttcgttgctt 

ccttcaggct gtttgctcgt acccgctcaa tgtggtcatt caacccagaa acaaacattc 

ttctcaatgt gcctctccgg gggacaattg tgaccagacc gctcatggaa agtgaacttg 

tcattggtgc tgtgatcatt cgtggtcact tgcgaatggc cggacactcc ctagggcgct 

gtgacattaa ggacctgcca aaagagatca ctgtggctac atcacgaacg ctttcttatt 

acaaattagg agcgtcgcag cgtgtaggca ctgattcagg ttttgctgca tacaaccgct 

accgtattgg aaactataaa ttaaatacag accacgccgg tagcaacgac aatattgctt 

tgctagtaca gtaagtgaca acagatgttt catcttgttg acttccagg 

^:nn> 1Q<-?11> 1231<212> DNA<213> CORONAVIRUS<400> 19 
taccgtat?g 2 gaaacSSa aitaaataca gaccacgccg gtagcaacga caatattgct 

ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc 
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agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat 180 

aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 240 

agatgatgaa gaacctatgg agttagatta tccataaaac gaacatgaaa attattctct 300 

tcctgacatt gattgtattt acatcttgcg agctatatca ctatcaggag tgtgttagag 360 

gtacgactgt actactaaaa gaaccttgcc catcaggaac atacgagggc aattcaccat 420 

ttcaccctct tgctgacaat aaatttgcac taacttgcac tagcacacac tttgcttttg 480 

cttgtgctga cggtactcga catacctatc agctgcgtgc aagatcagtt tcaccaaaac 540 

ttttcatcag acaagaggag gttcaacaag agctctactc gccacttttt ctcattgttg 600 

ctgctctagt atttttaata ctttgcttca ccattaagag aaagacagaa tgaatgagct 660 

cactttaatt gacttctatt tgtgcttttt agcctttctg ctattccttg ttttaataat 720 

gcttattata ttttggtttt cactcgaaat ccaggatcta gaagaacctt gtaccaaagt 780 

ctaaacgaac atgaaacttc tcattgrttt gacttgtatt tctctatgca gttgcatatg 840 

cactgtagta cagcgctgtg catctaataa acctcatgtg cttgaagatc cttgtaaggt 900 

acaacactag gggtaatact tatagcactg cttggctttg tgctctagga aaggttttac 960 

cttttcatag atggcacact atggttcaaa catgcacacc taatgttact atcaactgtc 1020 

aagatccagc tggtggtgcg cttatagcta ggtgttggta ccttcatgaa ggtcaccaaa 1080 

ctgctgcatt tagagacgta cttgttgttt taaataaacg aacaaattaa aatgtctgat 1140 

aatggacccc aatcaaacca acgtagtgcc ccccgcatta catttggtgg acccacagat 1200 

tcaactgaca ataaccagaa tggaggacgc a 1231 

<210> 20<211> 1242<212> DNA<213> CORONAVIRUS<400> 20 

gcatacaacc gctaccgtat tggaaactat aaattaaata cagaccacgc cggtagcaac 60 

gacaatattg ctttgctagt acagtaagtg acaacagatg tttcatcttg ttgacttcca 120 

ggttacaata gcagagatat tgattatcat tatgaggact ttcaggattg ctatttggaa 180 

tcttgacgtt ataataagtt caatagtgag acagttattt aagcctctaa ctaagaagaa 240 

ttattcggag ttagatgatg aagaacctat ggagttagat tatccataaa acgaacatga 300 

aaattattct cttcctgaca ttgattgtat ttacatcttg cgagctatat cactatcagg 360 

agtgtgttag aggtacgact gtactactaa aagaaccttg cccatcagga acatacgagg 420 

gcaattcacc atttcaccct cttgctgaca ataaatttgc actaacttgc actagcacac 480 

actttgcttt tgcttgtgct gacggtactc gacataccta tcagctgcgt gcaagatcag 540 

tttcaccaaa acttttcatc agacaagagg aggttcaaca agagctctac tcgccacttt 600 

ttctcattgt tgctgctcta gtatttttaa tactttgctt caccattaag agaaagacag 660 

aatgaatgag ctcactttaa ttgacttcta tttgtgcttt ttagcctttc tgctattcct 720 

tgttttaata atgcttatta tattttggtt ttcactcgaa atccaggatc tagaagaacc 780 

ttgtaccaaa gtctaaacga acatgaaact tctcattgtt ttgacttgta tttctctatg 840 
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cagttgcata tgcactgtag tacagcgctg tgcatctaat aaacctcatg tgcttgaaga 900 

tccttgtaag gtacaacact aggggtaata cttatagcac tgcttggctt tgtgctctag 960 

gaaaggtttt accttttcat agatggcaca ctatggttca aacatgcaca cctaatgtta 1020 

ctatcaactg tcaagatcca gctggtggtg cgcttatagc taggtgttgg taccttcatg 1080 

aaggtcacca aactgctgca tttagagacg tacttgttgt tttaaataaa cgaacgaatt 1140 

aaaatgtctg ataatggacc ccaatcaaac caacgtagtg ccccccgcat tacatttggt 1200 

ggacccacag attcaactga caataaccag aatggaggac gc 1242 

<210> 21<211> 1231<212> DNA<213> CORONAVIRUS<220><221> CDS<222> 
(86)..(274)<223> 

<400> 21 

taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60 

ttgctagtac agtaagtgac aacag atg ttt cat ctt gtt gac ttc cag gtt 112 

Met Phe His Leu val Asp Phe Gin Val 
1 5 

aca ata gca gag ata ttg att ate att atg agg act ttc agg att get 160 
Thr lie Ala Glu lie Leu Tie lie lie Met Arg Thr Phe Arg lie Ala 
10 15 20 25 

att tgg aat ctt gac gtt ata ata agt tea ata gtq aga caa tta ttt 208 
lie Trp Asn Leu Asp val lie lie ser Ser lie val Arg Gin Leu Phe 
30 35 40 

aag cct eta act aag aag aat tat teg gag tta gat gat gaa gaa cct 256 
Lys Pro Leu Thr Lys Lys Asn Tyr Ser Glu Leu Asp Asp Glu Glu Pro 
45 50 55 



atg gag tta gat tat cca taaaacgaac atgaaaatta ttctcttcct 304 
Met Glu Leu Asp Tyr Pro 
60 



gacattgatt 


gtatttacat 


ettgegaget 


atatcactat 


caggagtgtg 


ttagaggtac 


364 


gactgtacta 


ctaaaagaac 


cttgcccatc 


aggaacatac 


gagggcaatt 


caccatttca 


424 


ccctcttgct 


gacaataaat 


ttgeactaac 


ttgeactage 


acacactttg 


ettttgettg 


484 


tgctgacggt 


actcgacata 


cctatcagct 


gcgtgcaaga 


tcagtttcac 


caaaactttt 


544 


catcagacaa 


gaggaggttc 


aacaagagct 


ctactcgcca 


ctttttctca 


ttgttgctgc 


604 


tctagtattt 


ttaatacttt 


gcttcaccat 


taagagaaag 


acagaatgaa 


tgagctcact 


664 


ttaattgact 


tctatttgtg 


etttttagee 


tttctgetat 


tccttgtttt 


aataatgett 


724 


attatatttt 


ggttttcact 


cgaaatccag 


gatctagaag 


aaccttgtac 


caaagtctaa 


784 


acgaacatga 


aacttctcat 


tgttttgact 


tgtatttctc 


tatgcagttg 


catatgeact 


844 


gtagtacagc 


gctgtgcatc 


taataaacct 


catgtgcttg 


aagatccttg 


taaggtacaa 


904 


cactaggggt 


aatacttata 


geactgettg 


gctttgtgct 


ctaggaaagg 


ttttaccttt 


964 


tcatagatgg 


cacactatgg 


ttcaaacatg 


cacacctaat 


gttactatca 


actgtcaaga 


1024 


tccagctggt 


ggtgcgctta 


tagctaggtg 


ttggtacctt 


catgaaggtc 


accaaactgc 


1084 


tgcatttaga 


gaegtacttg 


ttgttttaaa 


taaacgaaca 
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gaccccaatc aaaccaacgt agtgcccccc gcattacatt tggtggaccc acagattcaa 1204 
ctgacaataa ccagaatgga ggacgca 12 31 

<210> 22<211> 63<212> PRT<213> CORONAVIRUS<400> 22 

Met Phe His Leu yal Asp Phe Gin val Thr lie Ala Glu He Leu He 
-L 5 10 15 

lie He Met Arg Thr Phe Arg lie Ala He Trp Asn Leu Asp val lie 
20 25 30 

He ser Ser lie Val Arg Gin Leu Phe Lys Pro Leu Thr Lys Lys Asn 
35 40 45 

Tyr ser Glu Leu Asp Asp Glu Glu Pro Met Glu Leu Asp Tyr Pro 
50 55 60 

C285)..(650)i223i 231<212> ° NA<213> CORONAVIRUS<220><221> CDS<222> 
<400> 23 

taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60 

ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc 120 

agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat 180 

aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 240 

agatgatgaa gaacctatgg agttagatta tccataaaac gaac atg aaa att att 296 

Met Lys He He 

P tc Hu C F tg a 5 a ttq a $ t ata tt:t aca tct tgc gag eta tat cac tat 344 
Leu Phe Leu Thr Leu He val Phe Thr ser cys Glu Leu Tyr His Tyr 

b 10 15 20 

cag gag tgt gtt aga ggt acg act gta eta eta aaa gaa cct tac cca 3Q7 
Gin Glu cys val Arg GTy Thr Thr val Leu Leu Lys Glu Pro c?s Pro 
25 30 35 

tea gga aca tac gag ggc aat tea cca ttt cac cct ctt get qac aat 440 
Ser GTy Thr Tyr Glu GTy Asn ser Pro Phe His Pro Leu Ala Asp Isn 
40 45 50 

aaa ttt gca eta act tgc act age aca cac ttt get ttt get tat act 488 
Lys Phe Ala Leu Thr cys Thr ser Thr His Phe Ala Phe Ala cys Ala 
b5 60 65 

gae ggt act cga cat acc tat cag ctg cgt gca aga tea att tea cca <z*& 
Asp GTy Thr Arg His Thr Tyr Gin Leu Arg Ala A?g ser Val ler p£o 
/0 75 80 

aaa ctt ttc ate aga caa gag gag gtt caa caa qaq etc tac tea era sua 
Lys Leu Phe He Arg Gin Glu Glu val Gin Gin Glu Leu Tyr se? Pro 
Bi 90 95 100 

£2 £ SS SS fif JRJ ffj a S3 »s jr «; $ gj «« « 2 

105 110 115 
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att aag aga aag aca gaa tgaatgagct cactttaatt gacttctatt 
lie Lys Arg Lys Thr Glu 
120 

tgtgcttttt agcctttctg ctattccttg ttttaataat gcttattata ttttggtttt 740 
cactcgaaat ccaggatcta gaagaacctt gtaccaaagt ctaaacgaac atgaaacttc 800 
tcattgtttt gacttgtatt tctctatgca gttgcatatg cactgtagta cagcgctgtg 860 
catctaataa acctcatgtg cttgaagatc cttgtaaggt acaacactag gggtaatact 920 
tatagcactg cttggctttg tgctctagga aaggttttac cttttcatag atggcacact 980 
atggttcaaa catgcacacc taatgttact atcaactgtc aagatccagc tggtggtgcg 1040 
cttatagcta ggtgttggta ccttcatgaa ggtcaccaaa ctgctgcatt tagagacgta 1100 
cttgttgttt taaataaacg aacaaattaa aatgtctgat aatggacccc aatcaaacca 1160 
acgtagtgcc ccccgcatta catttggtgg acccacagat tcaactgaca ataaccagaa 1220. 

1231 

tggaggacgc a 

<210> 24<211> 122<212> PRT<213> CORONAVIRUS<400> 24 

Met Lys He He Leu Phe Leu Thr Leu lie val Phe Thr ser Cys Glu 
1 5 10 

Leu Tyr His Tyr Gin Glu cys Val Arg Gly Thr Thr val Leu Leu Lys 

Glu Pro cys Pro ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro 
35 40 4 -> 

Leu Ala Asp Asn Lys Phe Ala Leu Thr cys Thr Ser Thr His Phe Ala 
50 55 60 

Phe Ala cys Ala Asp Gly Thr Arg His Thr Tyr Gin Leu Arg Ala Arg 
65 70 75 ou 

ser Val Ser Pro Lys Leu Phe lie Arg Gin Glu Glu val Gin Gin Glu 
85 90 »3 

Leu Tyr ser Pro Leu Phe Leu lie Val Ala Ala Leu val Phe Leu lie 
100 105 HO 

Leu cys Phe Thr lie Lys Arg Lys Thr Glu 
115 120 

<210> 25<211> 1231<212> DNA<213> CORONAVIRUS<220><221> CDS<222> 
(650) . . (781)<223> 

taSgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60 

ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc 120 

agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat 180 
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aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 240 

agatgatgaa gaacctatgg agttagatta tccataaaac gaacatgaaa attattctct 300 

tcctgacatt gattgtattt acatcttgcg agctatatca ctatcaggag tgtgttagag 360 

gtacgactgt actactaaaa gaaccttgcc catcaggaac atacgagggc aattcaccat 420 

ttcaccctct tgctgacaat aaatttgcac taacttgcac tagcacacac tttgcttttg 480 

cttgtgctga cggtactcga catacctatc agctgcgtgc aagatcagtt tcaccaaaac 540 

ttttcatcag acaagaggag gttcaacaag agctctactc gccacttttt ctcattgttg 600 

ctgctctagt atttttaata ctttgcttca ccattaagag aaagacaga atg aat gag 658 

Met Asn Glu 
1 

etc act tta att gac ttc tat ttg tgc ttt tta gec ttt ctg eta ttc 706 
Leu Thr Leu lie Asp Phe Tyr Leu Cys Phe Leu Ala Phe Leu Leu Phe 
5 10 15 

ctt gtt tta ata atg ctt att ata ttt tgg ttt tea etc gaa ate cag 754 
Leu val Leu lie Met Leu He He Phe Trp Phe ser Leu Glu lie Gin 
20 25 30 35 

gat eta gaa gaa cct tgt ace aaa gtc taaacgaaca tgaaacttct 801 
Asp Leu Glu Glu Pro cys Thr Lys Val 
40 

cattgttttg acttgtattt etctatgeag ttgcatatgc actgtagtac agcgctgtgc 861 

atctaataaa cctcatgtgc ttgaagatcc ttgtaaggta caacactagg ggtaatactt 921 

atagcactgc ttggctttgt gctctaggaa aggttttacc ttttcataga tggcacacta 981 

tggttcaaac atgcacacct aatgttacta tcaactgtca agatccagct ggtggtgcgc 1041 

ttatagctag gtgttggtac cttcatgaag gtcaccaaac tgctgcattt agagaegtae 1101 

ttgttgtttt aaataaacga acaaattaaa atgtctgata atggacccca atcaaaccaa 1161 

cgtagtgccc cccgcattac atttggtgga cccacagatt caactgacaa taaccagaat 1221 

ggaggacgea 12 3i 

<210> 26<211> 44<212> PRT<213> CORONAVIRUS<400> 26 

Met Asn Glu Leu Thr Leu lie Asp Phe Tyr Leu cys Phe Leu Ala Phe 
1 5 10 15 

Leu Leu Phe Leu Val Leu lie Met Leu lie lie Phe Trp Phe ser Leu 
20 25 30 

Glu lie Gin Asp Leu Glu Glu Pro cys Thr Lys Val 
35 40 

27<211> 1231<212> DNA<213> CORONAVIRUS<220><221> CDS<222> 
(791)..(907)<223> 

<400> 27 

tacegtattg gaaactataa attaaataca gaecaegceg gtagcaacga caatattget 60 
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ttgctagtac 


agtaagtgac 


aacagatgtt 


S226CAS111. 
tcatcttgtt 


ST25 

gacttccagg 


ttacaatagc 


120 


agagatattg 


attatcatta 


tgaggacttt 


caggattget 


atttggaatc 


ttgacgttat 


180 


aataagttca 


atagtgagac 


aattatttaa 


gcctctaact 


aagaagaatt 


atteggagtt 


240 


agatgatgaa 


gaacctatgg 


agttagatta 


tccataaaac 


gaacatgaaa 


attattctct 


300 


tcctgacatt 


gattgtattt 


acatcttgeg 


agctatatca 


ctatcaggag 


tgtgttagag 


360 


gtacgactgt 


actactaaaa 


gaaccttgcc 


catcaggaac 


atacgagggc 


aattcaccat 


420 


ttcaccctct 


tgctgacaat 


aaatttgeae 


taacttgeae 


tagcacacac 


tttgcttttg 


480 


cttgtgctga 


cggtactcga 


cat acetate 


agctgcgtgc 


aagatcagtt 


tcaccaaaac 


540 


ttttcatcag 


acaagaggag 


gttcaacaag 


agctctactc 


gecacttttt 


ctcattgttg 


600 


ctgctctagt 


atttttaata 


etttgettea 


ccattaagag 


aaagacagaa 


tgaatgagct 


660 


cactttaatt 


gacttctatt 


tgtgcttttt 


agectttctg 


ctattccttg 


ttttaataat 


720 


gcttattata 


ttttggtttt 


cactcgaaat 


ccaggatcta 


gaagaacctt 


gtaccaaagt 


780 


ctaaacgaac 


atg aaa ctt etc att gtt ttg act tgt att tct 
Met Lys Leu Leu He Val Leu Thr Cys lie ser 


eta tgc 
Leu cys 


829 



10 

agt tgc ata tgc act gta gta cag cgc tgt gca tct aat aaa cct cat 877 
Ser Cys lie cys Thr Val Val Gin Arg Cys Ala ser Asn Lys Pro His 
15 20 25 

gtq ctt gaa gat cct tgt aag gta caa cac taggggtaat acttatagca 927 
Val Leu Glu Asp Pro cys Lys val Gin His 
30 35 

ctgcttggct ttgtgctcta ggaaaggttt taccttttca tagatggcac actatggttc 987 

aaacatgeae acctaatgtt actatcaact gtcaagatcc agctggtggt gegcttatag 1047 

ctaggtgttg gtaccttcat gaaggtcacc aaactgctgc atttagagac gtacttgttg 1107 

ttttaaataa acgaacaaat taaaatgtct gataatggac cccaatcaaa ecaaegtagt 1167 

gccccccgca ttacatttgg tggacccaca gattcaactg acaataacca gaatggagga 1227 

cgea 1231 

<210> 28<211> 39<212> PRT<213> CORONAVIRUS<400> 28 

Met Lys Leu Leu lie Val Leu Thr Cys lie Ser Leu Cys Ser Cys lie 
15 10 15 

Cys Thr val Val Gin Arg Cys Ala ser Asn Lys Pro His Val Leu Glu 
20 25 30 

Asp Pro cys Lys Val Gin His 
35 

<210> 29<211> 1231<212> DNA<213> CORONAVIRUS<220><221> CDS<222> 
(876)..(1127)<223> 

<400> 29 

tacegtattg gaaactataa attaaataca gaccacgceg gtagcaacga caatattget 60 
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ttgctagtac 


agtaagtgac 


aacagatgtt 


tcatcttgtt 


gacttccagg 


ttacaatagc 


120 


agagatattg 


attatcatta 


tgaggacttt 


caggattgct 


atttggaatc 


ttgacgttat 


180 


aataagttca 


atagtgagac 


aattatttaa 


gcctctaact 


aagaagaatt 


attcggagtt 


240 


agatgatgaa 


gaacctatgg 


agttagatta 


tccataaaac 


gaacatgaaa 


attattctct 


300 


tcctgacatt 


gattgtattt 


acatcttgcg 


agctatatca 


ctatcaggag 


tgtgttagag 


360 


gtacgactgt 


actactaaaa 


gaaccttgcc 


catcaggaac 


atacgagggc 


aattcaccat 


420 


ttcaccctct 


tgctgacaat 


aaatttgcac 


taacttgcac 


tagcacacac 


tttgcttttg 


480 


cttgtgctga 


cggtactcga 


catacctatc 


agctgcgtgc 


aagatcagtt 


tcaccaaaac 


540 


ttttcatcag 


acaagaggag 


gttcaacaag 


agctctactc 


gccacttttt 


ctcattgttg 


600 


ctgctctagt 


atttttaata 


ctttgcttca 


ccattaagag 


aaagacagaa 


tgaatgagct 


660 


cactttaatt 


gacttctatt 


tgtgcttttt 


agcctttctg 


ctattccttg 


ttttaataat 


720 


gcttattata 


ttttggtttt 


cactcgaaat 


ccaggatcta 


gaagaacctt 


gtaccaaagt 


780 


ctaaacgaac 


atgaaacttc 


tcattgtttt 


gacttgtatt 


tctctatgca 


gttgcatatg 


840 


cactgtagta 


cagcgctgtg 


catctaataa 


acctc atg tgc ttg aag 
Met Cys Leu Lys 


ate ctt 
lie Leu 
5 


893 



gta agg tac aac act agg ggt aat act tat age act get tgg ctt tgt 941 
val Arg Tyr Asn Thr Arg Gly Asn Thr Tyr ser Thr Ala Trp Leu Cys 
10 15 20 



get eta gqa aag gtt tta cct ttt cat aga tgg cac act atg gtt caa 989 
Ala Leu Gly Lys val Leu Pro Phe His Arg Trp His Thr Met Val Gin 
25 30 35 

aca tgc aca cct aat gtt act ate aac tgt caa gat cca get ggt ggt 1037 
Thr Cys Thr pro Asn val Thr lie Asn Cys Gin Asp Pro Ala Gly Gly 
40 45 50 

gcg ctt ata get agg tgt tgg tac ctt cat gaa ggt cac caa act get 1085 
Ala Leu lie Ala Arg cys Trp Tyr Leu His Glu Gly His Gin Thr Ala 
55 60 65 70 

gca ttt aga gac gta ctt gtt gtt tta aat aaa cga aca aat 1127 
Ala Phe Arg Asp Val Leu Val Val Leu Asn Lys Arg Thr Asn 
75 80 

taaaatgtct gataatggac cccaatcaaa ecaaegtagt gccccccgca ttacatttgg 1187 

tggacccaca gattcaactg acaataacca gaatggagga cgea 1231 



<210> 30<211> 84<212> PRT<213> CORONAVIRUS<400> 30 

Met cys Leu Lys lie Leu val Arg Tyr Asn Thr Arg Gly Asn Thr Tyr 
1 5 10 15 



Ser Thr Ala Trp Leu cys Ala Leu Gly Lys val Leu Pro Phe His Arg 
20 25 30 

Trp His Thr Met val Gin Thr cys Thr Pro Asn Val Thr lie Asn Cys 
35 40 45 
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60 
120 



Gin Asp Pro Ala Gly Gly Ala Leu lie Ala Arg Cys Trp Tyr Leu His 
50 55 oO 

Glu Gly His Gin Thr Ala Ala Phe Arg Asp val Leu Val val Leu Asn 
65 70 75 8U 

Lys Arg Thr Asn 

<210> 31<211> 21221<212> DNA<213> CORONA yiRUS<400> |J 
atggagagcc ttgttcttgg tgtcaacgag aaaacacacg tccaactcag tttgcctgtc 

cttcaggtta gagacgtgct agtgcgtggc ttcggggact ctgtggaaga ggccctatcg 

gaggcacgtg aacacctcaa aaatggcact tgtggtctag tagagctgga aaaaggcgta 180 

ctgccccagc ttgaacagcc ctatgtgttc attaaacgtt ctgatgcctt aagcaccaat 240 

cacggccaca aggtcgttga gctggttgca gaaatggacg gcattcagta cggtcgtagc 300 

ggtataacac tgggagtact cgtgccacat gtgggcgaaa ccccaattgc ataccgcaat 360 

gttcttcttc gtaagaacgg taataaggga gccggtggtx atagctatgg catcgatcta 

aagtcttatg acttaggtga cgagcttggc actgatccca ttgaagatta tgaacaaaac 

tggaacacta agcatggcag tggtgcactc cgtgaactca ctcgtgagct caatggaggt 540 

gcagtcactc gctatgtcga caacaatttc tgtggcccag atgggtaccc tcttgattgc 

atcaaagatt ttctcgcacg cgcgggcaag tcaatgtgca ctctttccga acaacttgat 

tacatcgagt cgaagagagg tgtctactgc tgccgtgacc atgagcatga aattgcctgg 

ttcactgagc gctctgataa gagctacgag caccagacac ccttcgaaat taagagtgcc 780 

aagaaatttg acactttcaa aggggaatgc ccaaagtttg tgtttcctct taactcaaaa 840 

gtcaaagtca ttcaaccacg tgttgaaaag aaaaagactg agggtttcat ggggcgtata 

cgctctgtgt accctgttgc atctccacag gagtgtaaca atatgcactt gtctaccttg 

atgaaatgta atcattgcga tgaagtttca tggcagacgt gcgactttct gaaagccact 1020 

tgtgaacatt gtggcactga aaatttagtt attgaaggac ctactacatg tgggtaccta 1080 

cctactaatg ctgtagtgaa aatgccatgt cctgcctgtc aagacccaga gattggacct 1140 

gagcatagtg ttgcagatta tcacaaccac tcaaacattg aaactcgact ccgcaaggga 1200 

ggtaggacta gatgttttgg aggctgtgtg tttgcctatg ttggctgcta taataagcgt 1260 

gcctactggg ttcctcgtgc tagtgctgat attggctcag gccatactgg cattactggt 1320 

gacaatgtgg agaccttgaa tgaggatctc cttgagatac tgagtcgtga acgtgttaac 1380 

attaacattg ttggcgattt tcatttgaat gaagaggttg ccatcatttt ggcatctttc 1440 

tctgcttcta caagtgcctt tattgacact ataaagagtc ttgattacaa gtctttcaaa 1500 

accattgttg agtcctgcgg taactataaa gttaccaagg gaaagcccgt aaaaggtgct 1560 

tggaacattg gacaacagag atcagtttta acaccactgt gtggttttcc ctcacaggct 1620 
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gctggtgtta 


tcagatcaat 


ttttgcgcgc 


acacttgatg 


cagcaaacca 


ctcaattcct 


1680 


gatttgcaaa 


gagcagctgt 


caccatactt 


gatggtattt 


ctgaacagtc 


attacgtctt 


1740 


gtcgacgcca 


tggtttatac 


ttcagacctg 


ctcaccaaca 


gtgtcattat 


tatggcatat 


1800 


gtaactggtg 


gtcttgtaca 


acagacttct 


cagtggttgt 


ctaatctttt 


gggcactact 


1860 


gttgaaaaac 


tcaggcctat 


ctttgaatgg 


attgaggcga 


aacttagtgc 


aggagttgaa 


1920 


tttctcaagg 


atgcttggga 


gattctcaaa 


tttctcatta 


caggtgtttt 


tgacatcgtc 


1980 


aagggtcaaa 


tacaggttgc 


ttcagataac 


atcaaggatt 


gtgtaaaatg cttcattgat 


2040 


gttgttaaca 


aggcactcga 


aatgtgcatt 


gatcaagtca 


ctatcgctgg 


cgcaaagttg 


2100 


cgatcactca 


acttaggtga 


agtcttcatc 


gctcaaagca 


agggacttta ccgtcagtgt 


2160 


atacgtggca 


aggagcagct 


gcaactactc 


atgcctctta aggcaccaaa agaagtaacc 


2220 


tttcttgaag 


gtgattcaca 


tgacacagta 


cttacctctg 


aggaggttgt tctcaagaac 


2280 


ggtgaactcg 


aagcactcga 


gacgcccgtt 


gatagcttca caaatggagc tatcgttggc 


2340 


acaccagtct 


gtgtaaatgg 


cctcatgctc 


ttagagatta 


aggacaaaga 


acaatactgc 


2400 


gcattgtctc 


ctggtttact 


ggctacaaac 


aatgtctttc gcttaaaagg gggtgcacca 


2460 


attaaaggtg 


taacctttgg 


agaagatact 


gtttgggaag ttcaaggtta caagaatgtg 


2520 


agaatcacat 


ttgagcttga 


tgaacgtgtt 


gacaaagtgc ttaatgaaaa gtgctctgtc 


2580 


tacactgttg 


aatccggtac 


cgaagttact 


gagtttgcat gtgttgtagc agaggctgtt 


2640 


gtgaagactt 


tacaaccagt 


ttctgatctc 


cttaccaaca tgggtattga tcttgatgag 


2700 


tggagtgtag 


ctacattcta 


cttatttgat 


gatgctggtg aagaaaactt ttcatcacgt 


2760 


atgtattgtt 


ccttttaccc 


tccagatgag 


gaagaagagg acgatgcaga gtgtgaggaa 


2820 


gaagaaattg 


atgaaacctg 


tgaacatgag 


tacggtacag 


aggatgatta tcaaggtctc 


2880 


cctctggaat 


ttggtgcctc 


agctgaaaca 


gttcgagttg 


aggaagaaga 


agaggaagac 


2940 


tggctggatg 


atactactga 


gcaatcagag 


attgagccag 


aaccagaacc 


tacacctgaa 


3000 


gaaccagtta 


atcagtttac 


tggttattta 


aaacttactg 


acaatgttgc 


cattaaatgt 


3060 


gttgacatcg 


ttaaggaggc 


acaaagtgct 


aatcctatgg 


tgattgtaaa 


tgctgctaac 


3120 


atacacctga 


aacatggtgg 


tggtgtagca 


ggtgcactca 


acaaggcaac 


caatggtgcc 


3180 


atgcaaaagg 


agagtgatga 


ttacattaag 


ctaaatggcc 


ctcttacagt 


aggagggtct 


3240 


tgtttgcttt 


ctggacataa 


tcttgctaag 


aagtgtctgc 


atgttgttgg 


acctaaccta 


3300 


aatgcaggtg 


aggacatcca 


gcttcttaag 


gcagcatatg 


aaaatttcaa 


ttcacaggac 


3360 


atcttacttg 


caccattgtt 


gtcagcaggc 


atatttggtg 


ctaaaccact 


tcagtcttta 


3420 


caagtgtgcg 


tgcagacggt 


tcgtacacag 


gtttatattg 


cagtcaatga 


caaagctctt 


3480 


tatgagcagg 


ttgtcatgga 


ttatcttgat 


aacctgaagc 


ctagagtgga 


agcacctaaa 


3540 


caagaggagc 


caccaaacac 


agaagattcc 


aaaactgagg 


agaaatctgt 


cgtacagaag 


3600 


cctgtcgatg 


tgaagccaaa 


aattaaggcc 


tgcattgatg 
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gaaactaagt 


ttcttaccaa 


taagttactc 


ttgtttgctg atatcaatgg 


taagctttac 


3720 


catgattctc 


agaacatgct 


tagaggtgaa 


gatatgtctt tccttgagaa 


ggatgcacct 


3780 


tacatggtag 


gtgatgttat 


cactagtggt 


gatatcactt gtgttgtaat 


accctccaaa 


3840 


aaggctggtg 


gcactactga 


gatgctctca 


agagctttga agaaagtgcc 


agttgatgag 


3900 


tatataacca 


cgtaccctgg 


acaaggatgt 


gctggttata cacttgagga 


agctaagact 


3960 


gctcttaaga 


aatgcaaatc 


tgcattttat 


gtactacctt cagaagcacc 


taatgctaag 


4020 


gaagagattc 


taggaactgt 


atcctggaat 


ttgagagaaa tgcttgctca 


tgctgaagag 


4080 


acaagaaaat 


taatgcctat 


atgcatggat 


gttagagcca taatggcaac 


catccaacgt 


4140 


aagtataaag 


gaattaaaat 


tcaagagggc 


atcgttgact atggtgtccg 


attcttcttt 


4200 


tatactagta 


aagagcctgt 


agcttctatt 


attacgaagc tgaactctct 


aaatgagccg 


4260 


cttgtcacaa 


tgccaattgg 


ttatgtgaca 


catggtttta atcttgaaga 


ggctgcgcgc 


4320 


tgtatgcgtt 


ctcttaaagc 


tcctgccgta 


gtgtcagtat catcaccaga 


tgctgttact 


4380 


acatataatg 


ganacctcac 


ttcgtcatca 


aagacatctg aggagcactt 


tgtagaaaca 


4440 


gtttctttgg 


ctggctctta 


cagagattgg 


tcctattcag gacagcgtac 


agagttaggt 


4500 


gttgaatttc 


ttaagcgtgg 


tgacaaaatt 


gtgtaccaca ctctggagag 


ccccgtcgag 


4560 


tttcatcttg 


acggtgaggt 


tctttcactt 


gacaaactaa agagtctctt 


atccctgcgg 


4620 


gaggttaaga 


ctataaaagt 


gttcacaact 


gtggacaaca ctaatctcca 


cacacagctt 


4680 


gtggatatgt 


ctatgacata 


tggacagcag 


tttggtccaa catacttgga 


tggtgctgat 


4740 


gttacaaaaa 


ttaaacctca 


tgtaaatcat 


gagggtaaga ctttctttgt 


actacctagt 


4800 


gatgacacac 


tiacgtagtga 


agctttcgag 


tactaccata ctcttgatga 


gagttttctt 


4860 


ggtaggtaca 


tgtctgcttt 


aaaccacaca 


aagaaatgga aatttcctca 


agttggtggt 


4920 


ttaacttcaa 


ttaaatgggc 


tgataacaat 


tgttatttgt ctagtgtttt 


attagcactt 


4980 


caacagcttg 


aagtcaaatt 


caatgcacca 


gcacttcaag aggcttatta 


tagagcccgt 


5040 


gctggtgatg 


ctgctaactt 


ttgtgcactc 


atactcgctt acagtaataa 


aactgttggc 


5100 


gagcttggtg 


atgtcagaga 


aactatgacc 


catcttctac agcatgctaa 


tttggaatct 


5160 


gcaaagcgag 


ttcttaatgt 


ggtgtgtaaa 


cattgtggtc agaaaactac 


taccttaacg 


5220 


ggtgtagaag 


ctgtgatgta 


tatgggtact 


ctatcttatg ataatcttaa 


gacaggtgtt 


5280 


tccattccat 


gtgtgtgtgg 


tcgtgatgct 


acacaatatc tagtacaaca 


agagtcttct 


5340 


tttgttatga 


tgtctgcacc 


acctgctgag 


tataaattac agcaaggtac 


attcttatgt 


5400 


gcgaatgagt 


acactggtaa 


ctatcagtgt 


ggtcattaca ctcatataac 


tgctaaggag 


5460 


accctctatc 


gtattgacgg 


agctcacctt 


acaaagatgt cagagtacaa 


aggaccagtg 


5520 


actgatgttt 


tctacaagga 


aacatcttac 


actacaacca tcaagcctgt 


gtcgtataaa 


5580 


ctcgatggag 


ttacttacac 


agagattgaa 


ccaaaattgg atgggtatta 


taaaaaggat 


5640 


aatgcttact 


atacagagca 


gcctatagac 


cttgtaccaa ctcaaccatt 


accaaatgcg 


5700 



Page 47 



1er depot 



S226CAS1U.ST25 

agttttgata atttcaaact cacatgttct aacacaaaat ttgctgatga tttaaatcaa 5760 

atgacaggct tcacaaagcc agcttcacga gagctatctg tcacattctt cccagacttg 5820 

aatggcgatg tagtggctat tgactataga cactattcag cgagtttcaa gaaaggtgct 5880 

aaattactgc ataagccaat tgtttggcac attaaccagg ctacaaccaa gacaacgttc 5940 

aaaccaaaca cttggtgttt acgttgtctt tggagtacaa agccagtaga tacttcaaat 6000 

tcatttgaag ttctggcagt agaagacaca caaggaatgg acaatcttgc ttgtgaaagt 6060 

caacaaccca cctctgaaga agtagtggaa aatcctacca tacagaagga agtcatagag 6120 

tgtgacgtga aaactaccga agttgtaggc aatgtcatac ttaaaccatc agatgaaggt 6180 

gttaaagtaa cacaagagtt aggtcatgag gatcttatgg ctgcttatgt ggaaaacaca 6240 

agcattacca ttaagaaacc taatgagctt tcactagcct taggtttaaa aacaattgcc 6300 

actcatggta ttgctgcaat taatagtgtt ccttggagta aaattttggc ttatgtcaaa 6360 

ccattcttag gacaagcagc aattacaaca tcaaattgcg ctaagagatt agcacaacgt 6420 

gtgtttaaca attatatgcc ttatgtgttt acattattgt tccaattgtg tacttttact 6480 

aaaagtacca attctagaat tagagcttca ctacctacaa ctattgctaa aaatagtgtt 6540 

aagagtgttg ctaaattatg tttggatgcc ggcattaatt atgtgaagtc acccaaattt 6600 

tctaaattgt tcacaatcgc tatgtggcta ttgttgttaa gtatttgctt aggttctcta 6660 

atctgtgtaa ctgctgcttt tggtgtactc ttatctaatt ttggtgctcc ttcttattgt 6720 

aatggcgtta gagaattgta tcttaattcg tctaacgtta ctactatgga tttctgtgaa 6780 

ggttcttttc cttgcagcat ttgtttaagt ggattagact cccttgattc ttatccagct 6840 

cttgaaacca ttcaggtgac gatttcatcg tacaagctag acttgacaat tttaggtctg 6900 

gccgctgagt gggttttggc atatatgttg ttcacaaaat tcttttattt attaggtctt 6960 

tcagctataa tgcaggtgtt ctttggctat tttgctagtc atttcatcag caattcttgg 7020 

ctcatgtggt ttatcattag tattgtacaa atggcacccg tttctgcaat ggttaggatg 7080 

tacatcttct ttgcttcttt ctactacata tggaagagct atgttcatat catggatggt 7140 

tgcacctctt cgacttgcat gatgtgctat aagcgcaatc gtgccacacg cgttgagtgt 7200 

acaactattg ttaatggcat gaagagatct ttctatgtct atgcaaatgg aggccgtggc 7260 

ttctgcaaga ctcacaattg gaattgtctc aattgtgaca cattttgcac tggtagtaca 7320 

ttcattagtg atgaagttgc tcgtgatttg tcactccagt ttaaaagacc aatcaaccct 7380 

actgaccagt catcgtatat tgttgatagt gttgctgtga aaaatggcgc gcttcacctc 7440 

tactttgaca aggctggtca aaagacctat gagagacatc cgctctccca ttttgtcaat 7500 

rtagacaatt tgagagctaa caacactaaa ggttcactgc ctattaatgt catagttttt 7560 

gatggcaagt ccaaatgcga cgagtctgct tctaagtctg cttctgtgta ctacagtcag 7620 

ctgatgtgcc aacctattct gttgcttgac caagctcttg tatcagacgt tggagatagt 7680 

actgaagttt ccgttaagat gtttgatgct tatgtcgaca ccttttcagc aacttttagt 7740 
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gttcctatgg aaaaacttaa ggcacttgtt gctacagctc acagcgagtt agcaaagggt 

gtagctttag atggtgtcct ttctacattc gtgtcagctg cccgacaagg tgttgttgat 

accgatgttg acacaaagga tgttattgaa tgtctcaaac tttcacatca ctctgactta 

gaagtgacag gtgacagttg taacaatttc atgctcacct ataataaggt tgaaaacatg 

acgcccagag atcttggcgc atgtattgac tgtaatgcaa ggcatatcaa tgcccaagta 

gcaaaaagtc acaatgtttc actcatctgg aatgtaaaag actacatgtc tttatctgaa 

cagctgcgta aacaaattcg tagtgctgcc aagaagaaca acataccttt tagactaact 8160 

tgtgctacaa ctagacaggt tgtcaatgtc ataactacta aaatctcact caagggtggt 8220 

aagattgtta gtacttgttt taaacttatg cttaaggcca cattattgtg cgttcttgct 8280 

gcattggttt gttatatcgt tatgccagta catacattgt caatccatga tggttacaca 8340 

aatgaaatca ttggttacaa agccattcag gatggtgtca ctcgtgacat catttctact 

gatgattgtt ttgcaaataa acatgctggt tttgacgcat ggtttagcca gcgtggtggt 

tcatacaaaa atgacaaaag ctgccctgta gtagctgcta tcattacaag agagattggt 8520 

ttcatagtgc ctggcttacc gggtactgtg ctgagagcaa tcaatggtga cttcttgcat 

tttctacctc gtgtttttag tgctgttggc aacatttgct acacaccttc caaactcatt 

gagtatagtg attttgctac ctctgcttgc gttcttgctg ctgagtgtac aatttttaag 

gatgctatgg gcaaacctgt gccatattgt tatgacacta atttgctaga gggttctatt 

tcttatagtg agcttcgtcc agacactcgt tatgtgctta tggatggttc catcatacag 

tttcctaaca cttacctgga gggttctgtt agagtagtaa caacttttga tgctgagtac 

tgtagacatg gtacatgcga aaggtcagaa gtaggtattt gcctatctac cagtggtaga 

tgggttctta ataatgagca ttacagagct ctatcaggag ttttctgtgg tgttgatgcg 

atgaatctca tagctaacat ctttactcct cttgtgcaac ctgtgggtgc tttagatgtg 

•tctgcttcag tagtggctgg tggtattatt gccatattgg tgacttgtgc tgcctactac 

tttatgaaat tcagacgtgt ttttggtgag tacaaccatg ttgttgctgc taatgcactt 

ttgtttttga tgtctttcac tatactctgt ctggtaccag cttacagctt tctgccggga 

gtctactcag tcttttactt gtacttgaca ttctatttca ccaatgatgt ttcattcttg 

gctcaccttc aatggtttgc catgttttct cctattgtgc ctttttggat aacagcaatc 

tatgtattct gtatttctct gaagcactgc cattggttct ttaacaacta tcttaggaaa 

agagtcatgt ttaatggagt tacatttagt accttcgagg aggctgcttt gtgtaccttt 

■ttgctcaaca aggaaatgta cctaaaattg cgtagcgaga cactgttgcc acttacacag 9540 

tataacaggt atcttgctct atataacaag tacaagtatt tcagtggagc cttagatact 

accagctatc gtgaagcagc ttgctgccac ttagcaaagg ctctaaatga ctttagcaac 

tcaggtgctg atgttctcta ccaaccacca cagacatcaa tcacttctgc tgttctgcag 

agtggtttta ggaaaatggc attcccgtca ggcaaagttg aagggtgcat ggtacaagta 9780 
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acctgtggaa ctacaactct taatggattg tggttggatg acacagtata ctgtccaaga 9840 

catgtcattt gcacagcaga agacatgctt aatcctaact atgaagatct gctcattcgc 9900 

aaatccaacc atagctttct tgttcaggct ggcaatgttc aacttcgtgt tattggccat 9960 

tctatgcaaa attgtctgct taggcttaaa gttgatactt ctaaccctaa gacacccaag 10020 

tataaatttg tccgtatcca acctggtcaa acattttcag ttctagcatg ctacaatggt 10080 

tcaccatctg gtgtttatca gtgtgccatg agacctaatc ataccattaa aggttctttc 10140 

cttaatggat catgtggtag tgttggtttt aacattgatt atgattgcgt gtctttctgc 10200 

tatatgcatc atatggagct tccaacagga gtacacgctg gtactgactt agaaggtaaa 10260 

ttctatggtc catttgttga cagacaaact gcacaggctg caggtacaga cacaaccata 10320 

acattaaatg ttttggcatg gctgtatgct gctgttatca atggtgatag gtggtttctt 10380 

aatagattca ccactacttt gaatgacttt aaccttgtgg caatgaagta caactatgaa 10440 

cctttgacac aagatcatgt tgacatattg ggacctcttt ctgctcaaac aggaattgcc 10500 

gtcttagata tgtgtgctgc tttgaaagag ctgctgcaga atggtatgaa tggtcgtact 10560 

atccttggta gcactatttt agaagatgag tttacaccat ttgatgttgt tagacaatgc 10620 

tctggtgtta ccttccaagg taagttcaag aaaattgtta agggcactca tcattggatg 10680 

cttttaactt tcttgacatc actattgatt cttgttcaaa gtacacagtg gtcactgttt 10740 

ttctttgttt acgagaatgc tttcttgcca tttactcttg gtattatggc aattgctgca 10800 

tgtgctatgc trgcttgttaa gcataagcac gcattcttgt gcttgtttct gttaccttct 10860 

cttgcaacag ttgcttactt taatatggtc tacatgcctg ctagctgggt gatgcgtatc 10920 

atgacatggc ttgaattggc tgacactagc ttgtctggtt ataggcttaa ggattgtgtt 10980 

atgtatgctt cagctttagt tttgcttatt ctcatgacag ctcgcactgt ttatgatgat 11040 

gctgctagac gtgtttggac actgatgaat gtcattacac ttgtttacaa agtctactat 11100 

ggtaatgctt tagatcaagc tatttccatg tgggccttag ttatttctgt aacctctaac 11160 

tattctggtg tcgttacgac tatcatgttt ttagctagag ctatagtgtt tgtgtgtgtt 11220 

gagtattacc cattgttatt tattactggc aacaccttac agtgtatcat gcttgtttat 11280 

tgtttcttag gctattgttg ctgctgctac tttggccttt tctgtttact caaccgttac 11340 

ttcaggctta ctcttggtgt ttatgactac ttggtctcta cacaagaatt taggtatatg 11400 

aactcccagg ggcttttgcc tcctaagagt agtattgatg ctttcaagct taacattaag 11460 

ttgttgggta ttggaggtaa accatgtatc aaggttgcta ctgtacagtc taaaatgtct 11520 

gacgtaaagt gcacatctgt ggtactgctc tcggttcttc aacaacttag agtagagtca 11580 

tcttctaaat tgtgggcaca atgtgtacaa ctccacaatg atattcttct tgcaaaagac 11640 

acaactgaag ctttcgagaa gatggtttct cttttgtctg ttttgctatc catgcagggt 11700 

gctgtagaca ttaataggtt gtgcgaggaa atgctcgata accgtgctac tcttcaggct 11760 

attgcttcag aatttagttc tttaccatca tatgccgctt atgccactgc ccaggaggcc 11820 
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tatgagcagg ctgtagctaa tggtgattct gaagtcgttc tcaaaaagtt aaagaaatct 11880 

ttgaatgtgg ctaaatctga gtttgaccgt gatgctgcca tgcaacgcaa gttggaaaag 11940 

atggcagatc aggctatgac ccaaatgtac aaacaggcaa gatctgagga caagagggca 12000 

aaagtaacta gtgctatgca aacaatgctc ttcactatgc ttaggaagct tgataatgat 12060 

gcacttaaca acattatcaa caatgcgcgt gatggttgtg ttccactcaa catcatacca 12120 

ttgactacag cagccaaact catggttgtt gtccctgatt atggtaccta caagaacact 12180 

tgtgatggta acacctttac atatgcatct gcactctggg aaatccagca agttgttgat 12240 

gcggatagca agattgttca acttagtgaa attaacatgg acaattcacc aaatttggct 12300 

tggcctctta ttgttacagc tctaagagcc aactcagctg ttaaactaca gaataatgaa 12360 

ctgagtccag tagcactacg acagatgtcc tgtgcggctg gtaccacaca aacagcttgt 12420 

actgatgaca atgcacttgc ctactataac aattcgaagg gaggtaggtt tgtgctggca 12480 

ttactatcag accaccaaga tctcaaatgg gctagattcc ctaagagtga tggtacaggn 12540 

acaatttaca cagaactgga accaccttgt aggtttgtta cagacacacc aaaagggcct 12600 

aaagtgaaat acttgtactt catcaaaggc ttaaacaacc taaatagagg tatggtgctg 12660 

ggcagtttag ctgctacagt acgtcttcag gctggaaatg ctacagaagt acctgccaat 12720 

tcaactgtgc tttccttctg tgcttttgca gtagaccctg ctaaagcata taaggattac 12780 

ctagcaagtg gaggacaacc aatcaccaac tgtgtgaaga tgttgtgtac acacactggt 12840 

acaggacagg caattactgt aacaccagaa gctaacatgg accaagagtc ctttggtggt 12900 

gcttcatgtt gtctgtattg tagatgccac attgaccatc caaatcctaa aggattctgt 12960 

gacttgaaag gtaagtacgt ccaaatacct accacttgtg ctaatgaccc agtgggtttt 13020 

acacttagaa acacagtctg taccgtctgc ggaatgtgga aaggttatgg ctgtagttgt 13080 

gaccaactcc gcgaaccctt gatgcagtct gcggatgcat caacgttttt aaacgggttt 13140 

gcggtgtaag tgcagcccgt cttacaccgt gcggcacagg cactagtact gatgtcgtct 13200 

acagggcttt tgatatttac aacgaaaaag ttgctggttt tgcaaagttc ctaaaaacta 13260 

attgctgtcg cttccaggag aaggatgagg aaggcaattt attagactct tactttgtag 13320 

ttaagaggca tactatgtct aactaccaac atgaagagac tatttataac tuggttaaag 13380 

attgtccagc ggttgctgtc catgactttt tcaagtttag agtagatggt gacatggtac 13440 

cacatatatc acgtcagcgt ctaactaaat acacaatggc tgatttagtc tatgctctac 13500 

gtcattttga tgagggtaat tgtgatacat taaaagaaat actcgtcaca tacaattgct 13560 

gtgatgatga ttatttcaat aagaaggatt ggtatgactt cgtagagaat cctgacatct 13620 

tacgcgtata tgctaactta ggtgagcgtg tacgccaatc attattaaag actgtacaat 13680 

tctgcgatgc tatgcgtgat gcaggcattg taggcgtact gacattagat aatcaggatc 13740 

ttaatgggaa ctggtacgat ttcggtgatt tcgtacaagt agcaccaggc tgcggagttc 13800 

ctattgtgga ttcatattac tcattgctga tgcccatcct cactttgact agggcattgg 13860 
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ctgctgagtc ccatatggat gctgatctcg caaaaccact tattaagtgg gatttgctga 13920 

aatatgattt tacggaagag agactttgtc tcttcgaccg ttattttaaa tattgggacc 13980 

agacatacca tcccaattgt attaactgtt tggatgatag gtgtatcctt cattgtgcaa 14040 

actttaatgt gttattttct actgtgtttc cacctacaag ttttggacca ctagtaagaa 14100 

aaatatttgt agatggtgtt ccttttgttg tttcaactgg ataccatttt cgtgagttag 14160 

gagtcgtaca taatcaggat gtaaacttac atagctcgcg tctcagtttc aaggaacttt 14220 

tagtgtatgc tgctgatcca gctatgcatg cagcttctgg caatttattg ctagataaac 14280 

gcactacatg cttttcagta gctgcactaa caaacaatgt tgcttttcaa actgtcaaac 14340 

ccggtaattt taataaagac ttttatgact ttgctgtgtc taaaggtttc tttaaggaag 14400 

gaagttctgt tgaactaaaa cacttcttct ttgctcagga tggcaacgct gctatcagtg 14460 

attatgacta ttatcgttat aatctgccaa caatgtgtga tatcagacaa ctcctattcg 14520 

tagttgaagt tgttgataaa tactttgatt gttacgatgg tggctgtatt aatgccaacc 14580 

aagtaatcgt taacaatctg gataaatcag ctggtttccc atttaataaa tggggtaagg 14640 

ctagacttta ttatgactca atgagttatg aggatcaaga tgcacttttc gcgtatacta 14700 

agcgtaatgt catccctact ataactcaaa tgaatcttaa gtatgccatt agtgcaaaga 14760 

atagagctcg caccgtagct ggtgtctcta tctgtagtac tatgacaaat agacagtttc 14820 

atcagaaatt attgaagtca atagccgcca ctagaggagc tactgtggta attggaacaa 14880 

gcaagtttta cggtggctgg cataatatgt taaaaactgt ttacagtgat gtagaaactc 14940 

cacaccttat gggttgggat tatccaaaat gtgacagagc catgcctaac atgcttagga 15000 

taatggcctc tcttgttctt gctcgcaaac ataacacttg ctgtaactta tcacaccgtt 15060 

tctacaggtt agctaacgag tgtgcgcaag tattaagtga gatggtcatg tgtggcggct 15120 

cactatatgt taaaccaggt ggaacatcat ccggtgatgc tacaactgct tatgctaata 15180 

gtgtctttaa catttgtcaa gctgttacag ccaatgtaaa tgcacttctt tcaactgatg 15240 

gtaataagat agctgacaag tatgtccgca atctacaaca caggctxtat gagtgtctct 15300 

atagaaatag ggatgttgat catgaattcg tggatgagtt ttacgcttac ctgcgtaaac 15360 

atttctccat gatgattctt tctgatgatg ccgttgtgtg ctataacagt aactatgcgg 15420 

ctcaaggttt agtagctagc attaagaact ttaaggcagt tctttattat caaaataatg 15480 

tgttcatgtc tgaggcaaaa tgttggactg agactgacct tactaaagga cctcacgaat 15540 

tttgctcaca gcatacaatg ctagttaaac aaggagatga ttacgtgtac ctgccttacc 15600 

cagatccatc aagaatatta ggcgcaggct gttttgtcga tgatattgtc aaaacagatg 15660 

gtacacttat gattgaaagg ttcgtgtcac tggctattga tgcttaccca cttacaaaac 15720 

atcctaatca ggagtatgct gatgtctttc acttgtattt acaatacatt agaaagttac 15780 

atgatgagct tactggccac atgttggaca tgtattccgt aatgctaact aatgataaca 15840 

cctcacggta ctgggaacct gagttttatg aggctatgta cacaccacat acagtcttgc 15900 
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aggctgtagg tgcttgtgta ttgtgcaatt cacagacttc acttcgttgc ggtgcctgta 15960 

ttaggagacc attcctatgt tgcaagtgct gctatgacca tgtcatttca acatcacaca 16020 

aattagtgtt gtctgttaat ccctatgttt gcaatgcccc aggttgtgat gtcactgatg 16080 

tgacacaact gtatctagga ggtatgagct attattgcaa gtcacataag cctcccatta 16140 

gttttccatt atgtgctaat ggtcaggttt ttggtttata caaaaacaca tgtgtaggca 16200 

gtgacaatgt cactgacttc aatgcgatag caacatgtga ttggactaat gctggcgatt 16260 

acatacttgc caacacttgt actgagagac tcaagctttt cgcagcagaa acgctcaaag 16320 

ccactgagga aacatttaag ctgtcatatg gtattgccac tgtacgcgaa gtactctctg 16380 

acagagaatt gcatctttca tgggaggttg gaaaacctag accaccattg aacagaaact 16440 

atgtctttac tggttaccgt gtaactaaaa atagtaaagt acagattgga gagtacacct 16500 

ttgaaaaagg tgactatggt gatgctgttg tgtacagagg tactacgaca tacaagttga 16560 

atgttggtga ttactttgtg ttgacatctc acactgtaat gccacttagt gcacctactc 16620 

tagtgccaca agagcactat gtgagaatta ctggcttgta cccaacactc aacatctcag 16680 

atgagttttc tagcaatgtt gcaaattatc aaaaggtcgg catgcaaaag tactctacac 16740 

tccaaggacc acctggtact ggtaagagtc attttgccat cggacttgct ctctattacc 16800 

catctgctcg catagtgtat acggcatgct ctcatgcagc tgttgatgcc ctatgtgaaa 16860 

aggcattaaa atatttgccc atagataaat gtagtagaat catacctgcg cgtgcgcgcg 16920 

tagagtgttt tgataaattc aaagtgaatt caacactaga acagtatgtt ttctgcactg 16980 

taaatgcatt gccagaaaca actgctgaca ttgtagtctt tgatgaaatc tctatggcta 17040 

ctaattatga cttgagtgtt gtcaatgcta gacttcgtgc aaaacactac gtctatattg 17100 

gcgatcctgc tcaattacca gccccccgca cattgctgac taaaggcaca ctagaaccag 17160 

aatattttaa ttcagtgtgc agacttatga aaacaatagg tccagacatg ttccttggaa 17220 

cttgtcgccg ttgtcctgct gaaattgttg acactgtgag tgctttagtt tatgacaata 17280 

agctaaaagc acacaaggat aagtcagctc aatgcttcaa aatgttctac aaaggtgtta 17340 

ttacacatga tgtttcatct gcaatcaaca gacctcaaat aggcgttgta agagaatttc 17400 

ttacacgcaa tcctgcttgg agaaaagctg tttttatxtc accttataat tcacagaacg 17460 

ctgtagcttc aaaaatctta ggattgccta cgcagactgt tgattcatca cagggttctg 17520 

aatatgacta tgtcatattc acacaaacta ctgaaacagc acactcttgt aatgtcaacc 17580 

gcttcaatgt ggctatcaca agggcaaaaa ttggcatttt gtgcataatg tctgatagag 17640 

atctttatga caaactgcaa tttacaagtc tagaaatacc acgtcgcaat gtggctacat 17700 

tacaagcaga aaatgtaact ggacttttta aggactgtag taagatcatt actggtcttc 17760 

atcctacaca ggcacctaca cacctcagcg ttgatataaa gttcaagact gaaggattat 17820 

gtgttgacat accaggcata ccaaaggaca tgacctaccg tagactcatc tctatgatgg 17880 

gtttcaaaat gaattaccaa gtcaatggtt accctaatat gtttatcacc cgcgaagaag 17940 
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ctattcgtca cgttcgtgcg tggattggct ttgatgtaga gggctgtcat gcaactagag 18000 

atgctgtggg tactaaccta cctctccagc taggattttc tacaggtgtt aacttagtag 18060 

ctgtaccgac tggttatgtt gacactgaaa ataacacaga attcaccaga gttaatgcaa 18120 

aacctccacc aggtgaccag tttaaacatc ttataccact catgtataaa ggcttgccct 18180 

ggaatgtagt gcgtattaag atagtacaaa tgctcagtga tacactgaaa ggattgtcag 18240 

acagagtcgt gttcgtcctt tgggcgcatg gctttgagct tacatcaatg aagtactttg 18300 

tcaagattgg acctgaaaga acgtgttgtc tgtgtgacaa acgtgcaact tgcttttcta 18360 

cttcatcaga tacttatgcc tgctggaatc attctgtggg ttttgactat gtctataacc 18420 

catttatgat tgatgttcag cagtggggct ttacgggtaa ccttcagagt aaccatgacc 18480 

aacattgcca ggtacatgga aatgcacatg tggctagttg tgatgctatc atgactagat 18540 

gtttagcagt ccatgagtgc tttgttaagc gcgttgattg gtctgttgaa taccctatta 18600 

taggagatga actgagggtt aattctgctt gcagaaaagt acaacacatg gttgtgaagt 18660 

ctgcattgct tgctgataag tttccagttc ttcatgacat tggaaatcca aaggctatca 18720 

agtgtgtgcc tcaggctgaa gtagaatgga agttctacga tgctcagcca tgtagtgaca 18780 

aagcttacaa aatagaggaa ctcttctatt cttatgctac acatcacgat aaattcactg 18840 

atggtgtttg tttgttttgg aattgtaacg ttgatcgtta cccagccaat gcaattgtgt 18900 

gtaggtttga cacaagagtc ttgtcaaact tgaacttacc aggctgtgat ggtggtagtt 18960 

tgtatgtgaa taagcatgca ttccacactc cagctttcga taaaagtgca tttactaatt 19020 

taaagcaatt gcctttcttt tactattctg atagtccttg tgagtctcat ggcaaacaag 19080 

tagtgtcgga tattgattat gttccactca aatctgctac gtgtattaca cgatgcaatt 19140 

taggtggtgc tgtttgcaga caccatgcaa atgagtaccg acagtacttg gatgcatata 19200 

atatgatgat ttctgctgga tttagcctat ggatttacaa acaatttgat acttataacc 19260 

tgtggaatac atttaccagg ttacagagtt tagaaaatgt ggcttataat gttgttaata 19320 

aaggacactt tgatggacac gccggcgaag cacctgtttc catcattaat aatgctgttt 19380 

acacaaaggt agatggtatt gatgtggaga tctttgaaaa taagacaaca cttcctgtta 19440 

atgttgcatt tgagctttgg gctaagcgta acattaaacc agtgccagag attaagatac 19500 

tcaataattt gggtgttgat atcgctgcta atactgtaat ctgggactac aaaagagaag 19560 

ccccagcaca tgtatctaca ataggtgtct gcacaatgac tgacattgcc aagaaaccta 19620 

ctgagagtgc ttgttcttca cttactgtct tgtttgatgg tagagtggaa ggacaggtag 19680 

acctttttag aaacgcccgt aatggtgttt taataacaga aggttcagtc aaaggtctaa 19740 

caccttcaaa gggaccagca caagctagcg tcaatggagt cacattaatt ggagaatcag 19800 

taaaaacaca gtttaactac tttaagaaag tagacggcat tattcaacag ttgcctgaaa 19860 

cctactttac tcagagcaga gacttagagg attttaagcc cagatcacaa atggaaactg 19920 

actttctcga gctcgctatg gatgaattca tacagcgata taagctcgag ggctatgcct 19980 
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tcgaacacat cgtttatgga gatttcagtc atggacaact tggcggtctt catttaatga 
taggcttagc caagcgctca caagattcac cacttaaatt agaggatttt atccctatgg 
acagcacagt gaaaaattac ttcataacag atgcgcaaac aggttcatca aaatgtgtgt 
gttctgtgat tgatctttta cttgatgact ttgtcgagat aataaagtca caagatttgt 
cagtgatttc aaaagtggtc aaggttacaa ttgactatgc tgaaatttca ttcatgcttt 
ggtgtaagga tggacatgtt gaaaccttct acccaaaact acaagcaagt caagcgtggc 
aaccaggtgt tgcgatgcct aacttgtaca agatgcaaag aatgcttctt gaaaagtgtg 
accttcagaa ttatggtgaa aatgctgtta taccaaaagg aataatgatg aatgtcgcaa 
agtatactca actgtgtcaa tacttaaata cacttacttt agctgtaccc tacaacatga 
gagttattca ctttggtgct ggctctgata aaggagttgc accaggtaca gctgtgctca 
gacaatggtt gccaactggc acactacttg tcgattcaga tcttaatgac ttcgtctccg 
acgcagattc tactttaatt ggagactgtg caacagtaca tacggctaat aaatgggacc 
ttattattag cgatatgtat gaccctagga ccaaacatgt gacaaaagag aatgactcta 
aagaagggtt tttcacttat ctgtgtggat ttataaagca aaaactagcc ctgggtggtt 
ctatagctgt aaagataaca gagcattctt ggaatgctga cctttacaag cttatgggcc 
atttctcatg gtggacagct tttgttacaa atgtaaatgc atcatcatcg gaagcatttt 
taattggggc taactatctt ggcaagccga aggaacaaat tgatggctat accatgcatg 
ctaactacat tttctggagg aacacaaatc ctatccagtt gtcttcctat tcactctttg 
acatgagcaa atttcctctt aaattaagag gaactgctgt aatgtctctt aaggagaatc 
aaatcaatga tatgatttat tctcttctgg aaaaaggtag gcttatcatt agagaaaaca 
acagagttgt ggtttcaagt gatattcttg ttaacaacta a 

, 1ft> . :o«on-> 297<212> DNA<213> CORONAVIRUS<400> 32 
atggaccclf atcaai?caicgtag?gccc cccgcattac atttggtgga cccacagatt 

caactgacaa taaccagaat ggaggacgca atggggcaag gccaaaacag cgccgacccc 

aaggtttacc caataatact gcgtcttggt tcacagctct cactcagcat ggcaaggagg 

aacttagatt ccctcgaggc cagggcgttc caatcaacac caatagtggt ccagatgacc 

aaattggcta ctaccgaaga gctacccgac gagttcgtgg tggtgacggc aaaatga 

<210> 33<211> 98<212> PRT<213> CORONAVIRUS<400> 33 

Met Asp Pro Asn Gin Thr Asn Val Val Pro Pro Ala Leu His Leu val 

Asp Pro Gin He Gin Leu Thr He Thr Arg Met Glu Asp Ala Met Gly 

Gin Gly Gin Asn ser Ala Asp Pro Lys Val Tyr Pro lie lie Leu Arg 
35 40 ^° 
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60 
120 
180 
240 
297 
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Leu Gly Ser Gin Leu Ser Leu Ser Met Ala Arg Arg Asn Leu Asp Ser 
50 55 60 

Leu Glu Ala Arg Ala phe Gin ser Thr Pro lie Val val Gin Met Thr 
65 ~ 70 75 80 

Lys Leu Ala Thr Thr Glu Glu Leu Pro Asp Glu Phe Val Val Val Thr 
85 90 95 

Ala Lys 



<210> 34<211> 213<212> DNA<213> CORONAVIRUS<400> 34 

atgctgccac cgtgctacaa cttcctcaag gaacaacatt gccaaaaggc ttctacgcag 60 

agggaagcag aggcggcagt caagcctctt ctcgctcctc atcacgtagt cgcggtaatt 120 

caagaaattc aactcctggc agcagtaggg gaaattctcc tgctcgaatg gctagcggag 180 

gtggtgaaac tgccctcgcg ctattgctgc tag 213 

<210> 35<211> 70<212> PRT<213> CORONAVIRUS<400> 35 

Met Leu Pro Pro Cys Tyr Asn Phe Leu Lys Glu Gin His Cys Gin Lys 
1 5 10 15 

Ala Ser Thr Gin Arg Glu Ala Glu Ala Ala Val Lys Pro Leu Leu Ala 
20 25 30 

Pro His His val val Ala val lie Gin Glu lie Gin Leu Leu Ala Ala 
35 40 45 

Val Gly Glu lie Leu Leu Leu Glu Trp Leu Ala Glu Val val Lys Leu 
50 55 60 

Pro Ser Arg Tyr Cys Cys 
65 70 

<210> 36<211> 1377<212> DNA<213> CORONAVIRUS<220><221> CDS<222> 
(67). .(1335)<223> 

<400> 36 

atgaaggtca ccaaactgct gcatttagag acgtacttgt tgttttaaat aaacgaacaa 60 
attaaa atg tct gat aat gqa ccc caa tea aac caa cgt agt gec ccc 108 



156 



Met Ser Asp Asn Gly Pro Gin Ser Asn Gin Arg ser Ala Pro 
15 10 

cgc att aca ttt ggt gqa ccc aca gat tea act gac aat aac cag aat 
Arg lie Thr phe Gly Gly Pro Thr Asp Ser Thr Asp Asn Asn Gin Asn 
15 20 25 30 

gqa gqa cgc aat gqg gca agg cca aaa cag cgc cga ccc caa ggt tta 204 
Gly Gly Arg Asn Gly Ala Arg Pro Lys Gin Arg Arg Pro Gin Gly Leu 
35 40 45 
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ccc aat aat act gcg tct tgg ttc aca get etc act cag cat ggc aag 
Pro Asn Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gin His Gly Lys 
50 55 60 

gag gaa ctt aga ttc cct cga ggc cag ggc gtt cca ate aac acc aat 
Glu Glu Leu Arg Phe Pro Arg Gly Gin Gly Val Pro lie Asn Thr Asn 
65 70 75 

agt ggt cca gat gac caa att ggc tac tac cga aga get acc cga cga 
Ser Gly Pro Asp Asp Gin lie Gly Tyr Tyr Arg Arg Ala Thr Arg Arg 
80 85 90 

qtt cat ggt ggt gac ggc aaa atg aaa gag etc age ccc aga tgg tac 
val Arg Gly Gly Asp Gly Lys Met Lys Glu Leu ser Pro Arg Trp Tyr 
95 100 105 110 

ttc tat tac eta gga act ggc cca gaa get tea ctt ccc tac ggc get 
Phe Tyr Tyr Leu Gly Thr Gly Pro Glu Ala Ser Leu Pro Tyr Gly Ala 
115 120 125 

aac aaa gaa ggc ate gta tgg gtt gca act gag gga gee ttg aat aca 
Asn Lys Glu Gly lie Val Trp Val Ala Thr Glu Gly Ala Leu Asn Thr 
130 135 140 

ccc aaa gac cac att ggc acc cgc aat cct aat aac aat get gec acc 
Pro Lys Asp His lie Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Thr 
145 150 155 



ttc gqg gac caa gac eta ate aga caa gga act gat tac aaa cat tgg 
Phe Gly Asp Gin Asp Leu lie Arg Gin Gly Thr Asp Tyr Lys His Trp 
290 295 300 

ccg caa att gca caa ttt get cca agt gec tct gca ttc ttt gga atg 
Pro Gin lie Ala Gin phe Ala Pro ser Ala Ser Ala Phe Phe Gly Met 
305 310 315 

Page 57 



252 



300 



348 



396 



444 



492 



540 



gtg eta caa ctt cct caa gga aca aca ttg cca aaa ggc ttc tac gca 588 
val Leu Gin Leu Pro Gin Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala 
160 165 170 

gag gga age aga ggc ggc agt caa gee tct tct cgc tec tea tea cgt 
Glu Gly Ser Arg Gly Gly ser Gin Ala Ser Ser Arg Ser Ser ser Arg 
175 180 185 190 

agt cgc ggt aat tea aga aat tea act cct ggc age agt agg gga aat 
ser Arg Gly Asn Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Asn 
195 200 205 

tct cct get cga atg get age gga got ggt gaa act gec etc gcg eta 732 
Ser Pro Ala Arg Met Ala Ser Gly Gly Gly Glu Thr Ala Leu Ala Leu 
210 215 220 



636 



684 



780 
828 



ttg ctg eta gac aga ttg aac cag ctt gag age aaa gtt tct ggt aaa 
Leu Leu Leu Asp Arg Leu Asn Gin Leu Glu Ser Lys Val Ser Gly Lys 
225 230 235 

ggc caa caa caa caa ggc caa act gtc act aag aaa tct get get gag 
Gly Gin Gin Gin Gin Gly Gin Thr val Thr Lys Lys Ser Ala Ala Glu 
240 245 250 

gca tct aaa aag cct cgc caa aaa cgt act gee aca aaa cag tac aac 876 
Ala ser Lys Lys Pro Arg Gin Lys Arg Thr Ala Thr Lys Gin Tyr Asn 
255 260 265 270 

gtc act caa gca ttt ggg aga cgt ggt cca gaa caa acc caa gga aat 
val Thr Gin Ala Phe Gly Arg Arg Gly Pro Glu Gin Thr Gin Gly Asn 
275 280 285 



924 



972 
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tea cgc att gqc atg gaa gtc aca cct teg gga aca tgg ctg act tat 1068 
ser Arg lie Gly Met Glu Val Thr Pro ser Gly Thr Trp Leu Thr Tyr 
320 325 330 



cat gga gec att aaa ttg gat gac aaa gat cca caa ttc aaa gac aac 
His Gly Ala lie Lys Leu Asp Asp Lys Asp Pro Gin Phe Lys Asp Asn 
335 340 345 350 



Thr Glu Pro Lys Lys Asp Lys Lys Lys Lys Thr Asp Glu Ala Gin Pro 
370 375 



get gac atg gat gat ttc tec aga caa ctt caa aat tec atg agt gga 
Ala Asp Met Asp Asp Phe ser Arg Gin Leu Gin Asn Ser Met Ser Gly 
400 405 410 



1116 



gtc ata ctg ctg aac aag cac att gac gca tac aaa aca ttc cca cca 1164 
val lie Leu Leu Asn Lys His lie Asp Ala Tyr Lys Thr Phe Pro Pro 
355 360 365 



aca gag cct aaa aag gac aaa aag aaa aag act gat gaa get cag cct 1212 

Lys Lys Thr Asp Glu Ala 
375 380 



ttg ccg cag aga caa aag aag cag ccc act gtg act ctt ctt cct gcg 1260 
Leu Pro Gin Arg Gin Lys Lys Gin Pro Thr Val Thr Leu Leu Pro Ala 
385 390 395 



1308 



get tct get gat tea act cag gca taa acactcatga tgaccacaca 1355 
Ala ser Ala Asp ser Thr Gin Ala 
415 420 

aggcagatgg gctatgtaaa eg 1377 

<210> 37<211> 422<212> PRT<213> CORONAVIRUS<400> 37 

Met Ser Asp Asn Gly Pro Gin ser Asn Gin Arg ser Ala Pro Arg lie 
1 5 10 15 

Thr Phe Gly Gly Pro Thr Asp ser Thr Asp Asn Asn Gin Asn Gly Gly 
20 25 30 

Arg Asn Gly Ala Arg Pro Lys Gin Arg Arg Pro Gin Gly Leu Pro Asn 
35 40 45 

Asn Thr Ala ser Trp Phe Thr Ala Leu Thr Gin His Gly Lys Glu Glu 
50 55 60 

Leu Arg Phe Pro Arg Gly Gin Gly val Pro lie Asn Thr Asn ser Gly 
65 70 75 80 

Pro Asp Asp Gin lie Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Val Arg 
85 90 95 

Gly Gly Asp Gly Lys Met Lys Glu Leu ser Pro Arg Trp Tyr Phe Tyr 
100 105 110 

Tyr Leu Gly Thr Gly Pro Glu Ala Ser Leu Pro Tyr Gly Ala Asn Lys 
115 120 125 

Glu Gly lie val Trp val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys 
130 135 140 
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Asp His lie Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Thr val Leu 
145 150 155 160 

Gin Leu Pro Gin Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly 
165 170 175 

Ser Arg Gly Gly Ser Gin Ala ser Ser Arg Ser ser ser Arg ser Arg 
180 185 190 

Gly Asn ser Arg Asn Ser Thr pro Gly Ser Ser Arg Gly Asn ser Pro 
195 200 205 

Ala Arg Met Ala Ser Gly Gly Gly Glu Thr Ala Leu Ala Leu Leu Leu 
210 215 220 

Leu Asp Arg Leu Asn Gin Leu Glu ser Lys Val ser Gly Lys Gly Gin 
225 ~ 230 235 240 

Gin Gin Gin Gly Gin Thr val Thr Lys Lys Ser Ala Ala Glu Ala ser 
245 250 255 

Lys Lys Pro Arg Gin Lys Arg Thr Ala Thr Lys Gin Tyr Asn val Thr 
260 265 270 

Gin Ala Phe Gly Arg Arg Gly Pro Glu Gin Thr Gin Gly Asn Phe Gly 
275 280 285 

Asp Gin Asp Leu lie Arg Gin Gly Thr Asp Tyr Lys His Trp pro Gin 
290 295 300 

lie Ala Gin Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg 
305 310 315 320 

lie Gly Met Glu val Thr Pro Ser Gly Thr Trp Leu Thr Tyr His Gly 
325 330 335 

Ala lie Lys Leu Asp Asp Lys Asp Pro Gin Phe Lys Asp Asn Val lie 
340 345 350 

Leu Leu Asn Lys His lie Asp Ala Tyr Lys Thr phe Pro Pro Thr Glu 
355 360 365 

Pro Lys Lys Asp Lys Lys Lys Lys Thr Asp Glu Ala Gin Pro Leu Pro 
370 375 380 

Gin Arg Gin Lys Lys Gin Pro Thr Val Thr Leu Leu pro Ala Ala Asp 
385 390 395 400 

Met Asp Asp Phe ser Arg Gin Leu Gin Asn ser Met ser Gly Ala ser 
405 410 415 
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S226CAS111.ST25 

Ala Asp Ser Thr Gin Ala 
420 

<210> 38<211> 1377<212> DNA<213> CORONAVIRUS<400> 38 

atgaaggtca ccaaactgct gcatttagag acgtacttgt tgttttaaat aaacgaacaa 60 

attaaaatgt ctgataatgg accccaatca aaccaacgta gtgccccccg cattacattt 120 

ggtggaccca cagattcaac tgacaataac cagaatggag gacgcaatgg ggcaaggcca 180 

aaacagcgcc gaccccaagg tttacccaat aatactgcgt cttggttcac agctctcact 240 

cagcatggca aggaggaact tagattccct cgaggccagg gcgttccaat caacaccaat 300 

agtggtccag atgaccaaat tggctactac cgaagagcta cccgacgagt tcgtggtggt 360 

gacggcaaaa tgaaagagct cagccccaga tggtacttct attacctagg aactggccca 420 

gaagcttcac ttccctacgg cgctaacaaa gaaggcatcg tatgggttgc aactgaggga 480 

gccttgaata cacccaaaga ccacattggc acccgcaatc ctaataacaa tgctgccacc 540 

gtgctacaac ttcctcaagg aacaacattg ccaaaaggct tctacgcaga gggaagcaga 600 

ggcggcagtc aagcctcttc tcgctcctca tcacgtagtc gcggtaattc aagaaattca 660 

actcctggca gcagtagggg aaattctcct gctcgaatgg ctagcggagg tggtgaaact 720 

gccctcgcgc tattgctgct agacagattg aaccagcttg agagcaaagt ttctggtaaa 780 

ggccaacaac aacaaggcca aactgtcact aagaaatctg ctgctgaggc atctaaaaag 840 

cctcgccaaa aacgtactgc cacaaaacag tacaacgtca ctcaagcatt tgggagacgt 900 

ggtccagaac aaacccaagg aaatttcggg gaccaagacc taatcagaca aggaactgat 960 

tacaaacatt ggccgcaaat tgcacaattrt gctccaagtg cctctgcatt ctttggaatg 1020 

tcacgcattg gcatggaagt cacaccttcg ggaacatggc tgacttatca tggagccatt 1080 

aaattggatg acaaagatcc acaattcaaa gacaacgtca tactgctgaa caagcacatt 1140 

gacgcataca aaacattccc accaacagag cctaaaaagg acaaaaagaa aaagactgat 1200 

gaagctcagc ctttgccgca gagacaaaag aagcagccca ctgtgactct tcttcctgcg 1260 

gctgacatgg atgatttctc cagacaactt caaaattcca tgagtggagc rtctgctgat 1320 

tcaactcagg cataaacact catgatgacc acacaaggca gatgggctat gtaaacg 1377 

<210> 39<211> 204<212> DNA<213> CORONAVIRUS<400> 39 

atattaggtt tttacctacc caggaaaagc caaccaacct cgatctcttg tagatctgtt 60 

ctctaaacga actttaaaat ctgtgtagct gtcgctcggc tgcatgccta gtgcacctac 120 

gcagtataaa caataataaa ttttactgtc gttgacaaga aacgagtaac tcgtccctct 180 

tctgcagact gcttacggtt tcgt 204 

<210> 40<211> 809<212> DNA<213> CORONAVIRUS<400> 40 

actcaagcat ttgggagacg tggtccagaa caaacccaag gaaatttcgg ggaccaagac 60 

ctaatcagac aaggaactga ttacaaacat tggccgcaaa ttgcacaatt tgctccaagt 120 
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S226CAS111.ST25 1R ~ 
gcctctgcat tctttggaat gtcacgcatt ggcatggaag tcacaccttc gggaacatgg 180 

ctgacttatc atggagccat taaattggat gacaaagatc cacaattcaa agacaacgtc 240 
atactgctga acaagcacat tgacgcatac aaaacattcc caccaacaga gcctaaaaag 
gacaaaaaga aaaagactga tgaagctcag cctttgccgc agagacaaaa gaagcagccc 
actgtgactc ttcttcctgc ggctgacatg gatgatttct ccagacaact tcaaaattcc 
atgagtggag cttctgctga ttcaactcag gcataaacac tcatgatgac cacacaaggc 
agatgggcta tgtaaacgtt ttcgcaattc cgtttacgat acatagtcta ctcttgtgca 
gaatgaattc tcgtaactaa acagcacaag taggtttagt taactttaat ctcacatagc 
aatctttaat caatgtgtaa cattagggag gacttgaaag agccaccaca ttttcatcga 
ggccacgcgg agtracgatcg agggtacagt gaataatgct agggagagct gcctatatgg 
aagagcccta atgtgtaaaa ttaattttag tagtgctatc cccatgtgat tttaatagct 
tcttaggaga atgacaaaaa aaaaaaaaa 

,, 1(Vs A1^211> 448<212> DNA<213> CORONAVIRUS<400> 41 
altgaacaca 2 Sgg«g« caagctgggg cagtacgcct ttttccagct ctactagacc 

acaagtgcca tttttgaggt gttcacgtgc ctccgatagg gcctcttcca cagagtcccc 
gaagccacgc actagcacgt ctctaacctg aaggacaggc aaactgagtt ggacgtgtgt 
tttctxgttg acaccaagaa caaggctctc catcttacct ttcggtcaca cccggacgaa 
acctaggtat gctgatgatc gactgcaaca cggacgaaac cgtaagcagt ctgcagaaga 
gggacgagtt actcgtttct tgtcaacgac agtaaaattt attattgttt atactgcgta 
ggtgcactag gcatgcagcc gagcgacagc tacacagatt ttaaagttcg tttagagaac 
agatctacaa gagatcgagg ttggttgg 

ala^ag^ 60 
caacgagaaa acacacgtcc aactcagttt gcctgtcctl: caggttagag acgtgctagt 
gcgtggcttc ggggactctg tggaagaggc cctatcggag gcacgtgaac acctcaaaaa 
tggcacttgt ggtctagtag agctggaaaa aggcgtactg ccccagcttg aacagcccta 
tgtgttcatt aaacgttctg atgccttaag caccaatcac ggccacaagg tcgttgagct 
ggttgcagaa atggacggca ttcagtacgg tcgtagcggt ataacactgg gagtactcgt 
gccacatgtg ggcgaaaccc caattgcata ccgcaatgtt cttcttcgta agaacggtaa 
taagggagcc ggtggtcata gctatggcat cgatctaaag tcttatgact taggtgacga 
gcttggcact gatcccattg aagattatga acaaaactgg aacactaagc atggcagtgg 
tgcactccgt gaactcactc gtgagctcaa tggaggtgca gtcactcgct atgtcgacaa 
caatttctgt ggcccagatg ggtaccctct tgattgcatc aaagattttc tcgcacgcgc 
gggcaagtca atgtgcactc tttccgaaca acttgattac atcgagtcga agagaggtgt 
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300 

360 

420 

480 

540 

600 

660 

720 

780 

809 

60 
120 
180 
240 
300 
360 
420 
448 



120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 



■ t. 



1er depot 



ctactgctgc 
ctacgagcac 
ggaatgccca 
tgaaaagaaa 
tccacaggag 
agtttcatgg 
tttagttatt 
gccatgtcct 
caaccactca 
ctgtgtgttt 
tgctgatatt 
ggatctcctt 
tttgaatgaa 
tgacactata 
ctataaagtt 
agttttaaca 
tgcgcgcaca 
catacttgat 
agacctgctc 
gacttctcag 
tgaatggatt 
tctcaaattt 



cgtgaccatg 
cagacaccct 
aagtttgtgt 
aagactgagg 
tgtaacaata 
cagacgtgcg 
gaaggaccta 
gcctgtcaag 
aacattgaaa 
gcctatgttg 
ggctcaggcc 
gagatactga 
gaggttgcca 
aagagtcttg 
accaagggaa 
ccactgtgtg 
cttgatgcag 
ggtatttctg 
accaacagtg 
tggttgtcta 
gaggcgaaac 
ctcattacag 



agcatgaaat 
tcgaaattaa 
ttcctcttaa 
gtttcatggg 
tgcacttgtc 
actttctgaa 
ctacatgtgg 
acccagagat 
ctcgactccg 
gctgctataa 
atactggcat 
gtcgtgaacg 
tcattttggc 
attacaagtc 
agcccgtaaa 
gttttccctc 
caaaccactc 
aacagtcatt 
tcattattat 
atcttttggg 
ttagtgcagg 
gtgtttttga 



S226CAS111. 
tgcctggttc 



ST25 

actgagcgct 



gagtgccaag 
ctcaaaagtc 
gcgtatacgc 
taccttgatg 
agccacttgt 
gtacctacct 
tggacctgag 
caagggaggt 
taagcgtgcc 
tactggtgac 
tgttaacatt 
atctttctct 
tttcaaaacc 
aggtgcttgg 
acaggctgct 
aattcctgat 
acgtcttgtc 
ggcatatgta 
cactactgtt 
agttgaattt 
catcgtcaag 



aaatttgaca 
aaagtcattc 
tctgtgtacc 
aaatgtaatc 
gaacattgtg 
actaatgctg 
catagtgttg 
aggactagat 
tactgggttc 
aatgtggaga 
aacattgttg 
gcttctacaa 
attgttgagt 
aacattggac 
ggtgttatca 
ttgcaaagag 
gacgccatgg 
actggtggtc 
gaaaaactca 
ctcaaggatg 
ggtrcaaatac 



ctgataagag 
ctttcaaagg 
aaccacgtgt 
ctgttgcatc 
attgcgatga 
gcactgaaaa 
tagtgaaaat 
cagattatca 
gttttggagg 
ctcgtgctag 
ccttgaatga 
gcgattttca 
gtgcctttat 
cctgcggtaa 
aacagagatc 
gatcaatttt 
cagctgtcac 
tttatacttc 
ttgtacaaca 
ggcctatctt 
cttgggagat 
agg 



<210> 43<211> 2018<212> DNA<213> CORONAVIRUS<400> 43 
ggattgaggc gaaacttagt gcaggagttg aatttctcaa ggatgcttgg gagattctca 

aatttctcat tacaggtgtt tttgacatcg tcaagggtca aatacaggtt gcttcagata 
acatcaagga ttgtgtaaaa tgcttcattg atgttgttaa caaggcactc gaaatgtgca 
ttgatcaagt cactatcgct ggcgcaaagt tgcgatcact caacttaggt gaagtcttca 
tcgctcaaag caagggactt taccgtcagt gtatacgtgg caaggagcag ctgcaactac 
tcatgcctct taaggcacca aaagaagtaa cctttcttga aggtgattca catgacacag 
tacttacctc tgaggaggtt gttctcaaga acggtgaact cgaagcactc gagacgcccg 
ttgatagctt cacaaatgga gctatcgttg gcacaccagt ctgtgtaaat ggcctcatgc 
tcttagagat taaggacaaa gaacaatact gcgcattgtc tcctggttta ctggctacaa 
acaatgtctt tcgcttaaaa gggggtgcac caattaaagg tgtaaccttt ggagaagata 
ctgtttggga agttcaaggt tacaagaatg tgagaatcac atttgagctt gatgaacgtg 
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780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2033 

60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 



ttgacaaagt 
ctgagtttgc 
tccttaccaa 
atgatgctgg 
aggaagaaga 
agtacggtac 
cagttcgagt 
agattgagcc 
taaaacttac 
ctaatcctat 
caggtgcact 
agctaaatgg 
agaagtgtct 
aggcagcata 
gcatatttgg 
aggtttatat 
ataacctgaa 
ccaaaactga 
cctgcattga 
tcttgtttgc 
aagatatgtc 
gtgatatcac 
caagagcttt 



gcttaatgaa 

atgtgttgta 

catgggtatt 

tgaagaaaac 

ggacgatgca 

agaggatgat 

tgaggaagaa 

agaaccagaa 

tgacaatgtt 

ggtgattgta 

caacaaggca 

ccctcttaca 

gcatgttgrt 

tgaaaatttc 

tgctaaacca 

tgcagtcaat 

gcctagagtg 

ggagaaatct 

tgaggttace 

tgatatcaat 

tttccttgag 

ttgtgttgta 

gaagaaagtg 



S226CAS111. 
aagtgctctg tctacactgt 



ST25 

tgaatccggt 



gcagaggctg ttgtgaagac 
gatcttgatg agtggagtgt 
ttttcatcac gtatgtattg 
gagtgtgagg aagaagaaat 
tatcaaggtc tccctctgga 
gaagaggaag actggctgga 
cctacacctg aagaaccagt 
gccattaaat gtgttgacat 
aatgctgcta acatacacct 
accaatggtg ccatgcaaaa 
gtaggagggt cttgtttgct 
ggacctaacc taaatgcagg 
aattcacagg acatcttact 
cttcagtctt tacaagtgtg 
gacaaagctc tttatgagca 
gaagcaccta aacaagagga 
gtcgtacaga agcctgtcga 
acaacactgg aagaaactaa 
ggtaagcttt accatgattc 
aaggatgcac cttacatggt 
ataccctcca aaaaggctgg 
ccagttgatg agtatata 



tttacaacca 

agctacattc 

ttccttttac 

tgatgaaacc 

atttggtgcc 

tgatactact 

taatcagttt 

cgttaaggag 

gaaacatggt 

ggagagtgat 

ttctggacat 

tgaggacatc 

tgcaccattg 

cgtgcagacg 

ggttgtcatg 

gccaccaaac 

tgtgaagcca 

gtttcttacc 

tcagaacatg 

aggtgatgtt 

tggcactact 



<210> 44<211> 1442<212> DNA<213> CORONAVIRUS<400> 
ttgatgaggt taccacaaca ctggaagaaa ctaagtttct taccaataag 

ttgctgatat caatggtaag ctttaccatg attctcagaa catgcttaga 

tgtctttcct tgagaaggat gcaccttaca tggtaggtga tgttatcact 

tcacttgtgt tgtaataccc tccaaaaagg ctggtggcac tactgagatg 

ctttgaagaa agtgccagtt gatgagtata taaccacgta ccctggacaa 

gttatacact tgaggaagct aagactgctc ttaagaaatg caaatctgca 

taccttcaga agcacctaat gctaaggaag agattctagg aactgtatcc 

gagaaatgct tgctcatgct gaagagacaa gaaaattaan gcctatatgc 

gagccataat ggcaaccatc caacgtaagt ataaaggaat taaaattcaa 

ttgactatgg tgtccgattc ttcttttata ctagtaaaga gcctgtagct 
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accgaagtta 

gtttctgatc 

tacttatttg 

cctccagatg 

tgtgaacatg 

tcagctgaaa 

gagcaatcag 

actggttatt 

gcacaaagtg 

ggtggtgtag 

gattacatta 

aatcttgcta 

cagcttctta 

ttgtcagcag 

gttcgtacac 

gattatcttg 

acagaagatt 

aaaattaagg 

aataagttac 

cttagaggtg 

atcactagtg 

gagatgctct 

44 

ttactcttgt 
ggtgaagata 
agtggtgata 
ctctcaagag 
ggatgtgctg 
ttttatgtac 
tggaatttga 
atggatgtta 
gagggcatcg 
tctattatta 



720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2018 

60 
120 
180 
240 
300 
360 
420 
480 
540 
600 



1er dep6t 



cgaagctgaa 


ctctctaaat 


gagccgcttg 


S226CAS111 
tcacaatgcc 


.ST25 

aattggttat gtgacacatg 


660 


gttttaatct 


tgaagaggct 


gcgcgctgta 


tgcgttctct 


taaagctcct gccgtagtgt 


720 


cagtatcatc 


accagatgct 


gttactacat 


ataatggata 


cctcacttcg tcatcaaaga 


780 


catctgagga 


gcactttgta 


gaaacagttt 


ctttggctgg 


ctcttacaga gattggtcct 


840 


attcaggaca 


gcgtacagag 


ttaggtgttg 


aatttcttaa 


gcgtggtgac aaaattgtgt 


900 


accacactct 


ggagagcccc 


gtcgagtttc 


atcttgacgg 


tgaggttctt tcacttgaca 


960 


aactaaagag 


tctcttatcc 


ctgcgggagg 


ttaagactat 


aaaagtgttc 


acaactgtgg 


1020 


acaacactaa 


tctccacaca 


cagcttgtgg 


atatgtctat 


gacatatgga 


cagcagtttg 


1080 


gtccaacata 


cttggatggt 


gctgatgtta 


caaaaattaa 


acctcatgta aatcatgagg 


1140 


gtaagacttt 


ctttgtacta 


cctagtgatg 


acacactacg 


tagtgaagct 


ttcgagtact 


1200 


accatactct 


tgatgagagt 


tttcttggta 


ggtacatgtc 


tgctttaaac 


cacacaaaga 


1260 


aatggaaatt 


tcctcaagtt 


ggtggtttaa 


cttcaattaa 


atgggctgat 


aacaattgtt 


1320 


atttgtctag 


tgttttatta 


gcacttcaac 


agcttgaagt 


caaattcaat 


gcaccagcac 


1380 


ttcaagaggc 


ttattataga 


gcccgtgctg 


gtgatgctgc 


taacttttgt 


gcactcatac 


1440 


tc 












1442 


<210> 45<211> 1050<212> DNA<213> CORONAVIRUS<400> 
atatgtctat gacatatgga cagcagtttg gtccaacata cttggatggt 


45 

gctgatgtta 


60 


caaaaattaa 


acctcatgta 


aatcatgagg 


gtaagacttt 


ctttgtacta 


cctagtgatg 


120 


acacactacg 


tagtgaagct 


ttcgagtact 


accatactct 


tgatgagagt 


tttcttggta 


180 


ggtacatgtc 


tgctttaaac 


cacacaaaga 


aatggaaatt tcctcaagtt 


ggtggtttaa 


240 


cttcaattaa 


atgggctgat 


aacaattgtt 


atttgtctag tgttttatta gcacttcaac 


300 


agcttgaagt 


caaattcaat 


gcaccagcac 


ttcaagaggc ttattataga gcccgtgctg 


360 


gtgatgctgc 


taacttttgt 


gcactcatac 


tcgcttacag taataaaact gttggcgagc 


420 


ttggtgatgt 


cagagaaact 


atgacccatc 


ttctacagca tgctaatttg gaatctgcaa 


480 


agcgagttct 


taatgtggtg 


tgtaaacatt 


gtggtcagaa 


aactactacc 


ttaacgggtg 


540 


tagaagctgt 


gatgtatatg 


ggtactctat 


cttatgataa tcttaagaca ggtgtttcca 


600 


ttccatgtgt 


gtgtggtcgt 


gatgctacac 


aatatctagt 


acaacaagag tcttcttttg 


660 


ttatgatgtc 


tgcaccacct 


gctgagtata 


aattacagca aggtacattc ttatgtgcga 


720 


atgagtacac 


tggtaactat 


cagtgtggtc 


attacactca tataactgct aaggagaccc 


780 


tctatcgtat 


tgacggagct 


caccttacaa 


agatgtcaga gtacaaagga 


ccagtgactg 


RAH 


atgttttcta 


caaggaaaca 


tcttacacta 


caaccatcaa 


gcctgtgtcg tataaactcg 


900 


atggagttac 


ttacacagag 


attgaaccaa 


aattggatgg 


gtattataaa 


aaggataatg 


960 


cttactatac 


agagcagcct 


atagaccttg 


taccaactca 


accattacca aatgcgagtt 


1020 


ttgataattt 


caaactcaca 


tgttctaaca 








1050 
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S226CAS111.ST25 
<210> 46<211> 1995<212> DNA<213> CORONAVIRUS<400> 46 



tttgtgcact 


catactcgct 


tacagtaata 


aaactgttgg 


cgagcttggt 


gatgtcagag 


60 


aaactatgac 


ccatcttcta 


cagcatgcta 


atttggaatc 


tgcaaagcga 


gttcttaatg 


120 


tggtgtgtaa 


acattgtggt 


cagaaaacta 


ctaccttaac 


gggtgtagaa 


gctgtgatgt 


180 


atatgggtac 


tctatcttat 


gataatctta 


agacaggtgt 


ttccattcca 


tgtgtgtgtg 


240 


gtcgtgatgc 


tacacaatat 


ctagtacaac 


aagagtcttc 


ttttgttatg 


atgtctgcac 


300 


cacctgctga 


gtataaatta 


cagcaaggta 


cattcttatg 


tgcgaatgag 


tacactggta 


360 


actatcagtg 


tggtcattac 


actcatataa 


ctgctaagga 


gaccctctat 


cgtattgacg 


420 


gagctcacct 


tacaaagatg 


tcagagtaca 


aaggaccagt 


gactgatgrt 


ttctacaagg 


480 


aaacatctta 


cactacaacc 


atcaagcctg 


tgtcgtataa 


actcgatgga 


gttacttaca 


540 


cagagattga 


accaaaattg 


gatgggtatt 


ataaaaagga 


taatgcttac 


tatacagagc 


600 


agcctataga 


ccttgtacca 


actcaaccat 


taccaaatgc 


gagttttgat 


aatttcaaac 


660 


tcacatgttc 


taacacaaaa 


tttgctgatg 


atttaaatca 


aatgacaggc 


ttcacaaagc 


720 


cagcttcacg 


agagctatct 


gtcacattct 


tcccagactt 


gaatggcgat 


gtagtggcta 


780 


ttgactatag 


acactattca 


gcgagtttca 


agaaaggtgc 


taaattactg 


cataagccaa 


840 


ttgtttggca 


cattaaccag 


gctacaacca 


agacaacgtt 


caaaccaaac 


acttggtgtt 


900 


tacgttgtct 


ttggagtaca 


aagccagtag 


atacttcaaa 


ttcatttgaa 


gttctggcag 


960 


tagaagacac 


acaaggaatg 


gacaatcttg 


cttgtgaaag 


tcaacaaccc 


acctctgaag 


1020 


aagtagtgga 


aaatcctacc 


atacagaagg 


aagtcataga 


gtgtgacgtg 


aaaactaccg 


1080 


aagttgtagg 


caatgtcata 


cttaaaccat 


cagatgaagg 


tgttaaagta 


acacaagagt 


1140 


taggtcatga 


ggatcttatg 


gctgcttatg 


tggaaaacac 


aagcattacc 


attaagaaac 


1200 


ctaatgagct 


ttcactagcc 


ttaggtttaa 


aaacaattgc 


cactcatggt 


attgctgcaa 


1260 


ttaatagtgt 


tccttggagt 


aaaattttgg 


cttatgtcaa 


accattctta 


ggacaagcag 


1320 


caattacaac 


atcaaattgc 


gctaagagat 


tagcacaacg 


tgtgtttaac 


aattatatgc 


1380 


cttatgtgtt 


tacattattg 


ttccaattgt 


gtacttttac 


taaaagtacc 


aattctagaa 


1440 


ttagagcttc 


actacctaca 


actattgcta 


aaaatagtgt 


taagagtgtt 


gctaaattat 


1500 


gtttggatgc 


cggcattaat 


tatgtgaagt 


cacccaaatt 


ttctaaattg 


ttcacaatcg 


1560 


ctatgtggct 


attgttgtta 


agtatttgct 


taggttctct 


aatctgtgta 


actgctgctt 


1620 


ttggtgtact 


cttatctaat 


tttggtgctc 


cttcttattg 


taatggcgtt 


agagaattgt 


1680 


atcttaattc 


gtctaacgtt 


actactatgg 


atttctgtga 


aggttctttt 


ccttgcagca 


1740 


tttgtttaag 


tggattagac 


tcccttgatt 


cttatccagc 


tcttgaaacc 


attcaggtga 


1800 


cgatttcatc 


gtacaagcta 


gacttgacaa 


ttttaggtct 


ggccgctgag 


tgggttttgg 


1860 


catatatgtt 


gttcacaaaa 


ttcttttatt 


tattaggtct 


ttcagctata 


atgcaggtgt 


1920 


tctttggcta 


ttttgctagt 


catttcatca 


gcaattcttg 


gctcatgtgg 


tttatcatta 


1980 



IE- 
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S226CAS111.ST25 

gtattgtaca aatgg 1995 

<210> 47<211> 1884<212> DNA<213> CORONAVIRUS<400> 47 

aattcttggc tcatgtggtt tatcattagt attgtacaaa tggcacccgt ttctgcaatg 60 

gttaggatgt acatcttctt tgcttctttc tactacatat ggaagagcta tgttcatatc 120 

atggatggtt gcacctcttc gacttgcatg atgtgctata agcgcaatcg tgccacacgc 180 

gttgagtgta caactattgt taatggcatg aagagatctt tctatgtcta tgcaaatgga 240 

ggccgtggct tctgcaagac tcacaattgg aattgtctca attgtgacac attttgcact 300 

ggtagtacat tcattagtga tgaagttgct cgtgatttgt cactccagtt taaaagacca 360 

atcaacccta ctgaccagtc atcgtatatt gttgatagtg ttgctgtgaa aaatggcgcg 420 

cttcacctct actttgacaa ggctggtcaa aagacctatg agagacatcc gctctcccat 480 

tttgtcaatt tagacaattt gagagctaac aacactaaag gttcactgcc tattaatgtc 540 

atagtttttg atggcaagtc caaatgcgac gagtctgctt ctaagtctgc ttctgtgtac 600 

tacagtcagc tgatgtgcca acctattctg ttgcttgacc aagctcttgt atcagacgtt 660 

ggagatagta ctgaagtttc cgttaagatg tttgatgctt atgtcgacac cttttcagca 720 

acttttagtg ttcctatgga aaaacttaag gcacttgttg ctacagctca cagcgagtta 780 

gcaaagggtg tagctttaga tggtgtcctt tctacattcg tgtcagctgc ccgacaaggt 840 

gttgttgata ccgatgttga cacaaaggat gttattgaat gtctcaaact ttcacatcac 900 

tctgacttag aagtgacagg tgacagttgt aacaatttca tgctcaccta taataaggtt 960 

gaaaacatga cgcccagaga tcttggcgca tgtattgact gtaatgcaag gcatatcaat 1020 

gcccaagtag caaaaagtca caatgtttca ctcatctgga atgtaaaaga ctacatgtct 1080 

ttatctgaac agctgcgtaa acaaattcgt agtgctgcca agaagaacaa catacctttt 1140 

agactaactt gtgctacaac tagacaggtt gtcaatgtca taactactaa aatctcactc 1200 

aagggtggta agattgttag tacttgtttt aaacttatgc ttaaggccac attattgtgc 1260 

gttcttgctg cattggtttg ttatatcgtt atgccagtac atacattgtc aatccatgat 1320 

ggttacacaa atgaaatcat tggttacaaa gccattcagg atggtgtcac tcgtgacatc 1380 

atttctactg atgattgttt tgcaaataaa catgctggtt ttgacgcatg gtttagccag 1440 

cgtggtggtt catacaaaaa tgacaaaagc tgccctgtag tagctgctat cattacaaga 1500 

gagattggtt tcatagtgcc tggcttaccg ggtactgtgc tgagagcaat caatggtgac 1560 

ttcttgcatt ttctacctcg tgtttttagt gctgttggca acatttgcta cacaccttcc 1620 

aaactcattg agtatagtga ttttgctacc tctgcttgcg ttcttgctgc tgagtgtaca 1680 

atttttaagg atgctatggg caaacctgtg ccatattgtt atgacactaa tttgctagag 1740 

ggttctattt cttatagtga gcttcgtcca gacactcgtt atgtgcttat ggatggttcc 1800 

atcatacagt ttcctaacac ttacctggag ggttctgtta gagtagtaac aacttttgat 1860 

gctgagtact gtagacatgg taca 1884 
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S226CAS111.ST25 

<210> 48<211> 2020<212> DNA<213> CORONAVIRUS<400> 
cactcgttat gtgcttatgg atggttccat catacagttt cctaacactt 

ttctgttaga gtagtaacaa cttttgatgc tgagtactgt agacatggta 

gtcagaagta ggtatttgcc tatctaccag tggtagatgg gttcttaata 

cagagctcta tcaggagttt tctgtggtgt tgatgcgatg aatctcatag 

tactcctctt gtgcaacctg tgggtgcttt agatgtgtct gcttcagtag 

tattattgcc atattggtga cttgtgctgc ctactacttt atgaaattca 

tggtgagtac aaccatgttg ttgctgctaa tgcacttttg tttttgatgt 

actctgtctg gtaccagctt acagctttct gccgggagtc tactcagtct 

cttgacattc tatttcacca atgatgtttc attcttggct caccttcaat 

gttttctcct attgtgcctt tttggataac agcaatctat gtattctgta 

gcactgccat tggttcttta acaactatct taggaaaaga gtcatgttta 

atttagtacc ttcgaggagg ctgctttgtg tacctttttg ctcaacaagg 

aaaattgcgt agcgagacac tgttgccact tacacagtat aacaggtatc 

taacaagtac aagtatttca gtggagcctt agatactacc agctatcgtg 

ctgccactta gcaaaggctc taaatgactt tagcaactca ggtgctgatg 

accaccacag acatcaatca cttctgctgt tctgcagagt ggttttagga 

cccgtcaggc aaagttgaag ggtgcatggt acaagtaacc tgtggaacta 

tggattgtgg ttggatgaca cagtatactg tccaagacat gtcatttgca 

catgcttaat cctaactatg aagatctgct cattcgcaaa tccaaccata 

tcaggctggc aatgttcaac ttcgtgttat tggccattct atgcaaaatt 

gcttaaagtt gatacttcta accctaagac acccaagtat aaatttgtcc 

tggtcaaaca ttttcagttc tagcatgcta caatggttca ccatctggtg 

tgccatgaga cctaatcata ccattaaagg ttctttcctt aatggatcat 

tggttttaac attgattatg attgcgtgtc tttctgctat atgcatcata 

aacaggagta cacgctggta ctgacttaga aggtaaattc tatggtccat 

acaaactgca caggctgcag gtacagacac aaccataaca ttaaatrgttt 

gtatgctgct gttatcaatg gtgataggtg gtttcttaat agattcacca 

tgactttaac cttgtggcaa tgaagtacaa ctatgaacct ttgacacaag 

catattggga cctctttctg ctcaaacagg aattgccgtc ttagatatgt 

gaaagagctg ctgcagaatg gtatgaatgg tcgtactatc cttggtagca 

agatgagttt acaccatttg atgttgttag acaatgctct ggtgttacct 

gttcaagaaa attgttaagg gcactcatca ttggatgctt ttaactttct 

attgattctt gttcaaagta cacagtggtc actgtttttc tttgtttacg 
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48 

acctggaggg 
catgcgaaag 
atgagcatta 
ctaacatctt 
tggctggtgg 
gacgtgtttt 
ctttcactat 
tttacttgta 
ggtttgccat 
tttctctgaa 
atggagttac 
aaatgtacct 
ttgctctata 
aagcagcttg 
ttctctacca 
aaatggcatt 
caactcttaa 
cagcagaaga 
gctttcttgt 
gtctgcttag 
gtatccaacc 
tttatcagtg 
g-tggtagtgt 
tggagcttcc 
ttgtrtgacag 
tggcatggct 
ctactttgaa 
atcatgttga 
gtgctgcttt 
ctattttaga 
tccaaggtaa 
tgacatcact 
agaatgcttt 



60 




120 




180 




240 




300 




360 




420 




480 




540 




600 




660 




720 




780 




840 




900 




960 




1020 




1080 




1140 




1200 




1260 




1320 




1380 




1440 




1500 




1560 




1620 




1680 




1740 




1800 




1860 




1920 




1980 





1er depot 



S226CAS111.ST25 

cttgccattt actcttggta ttatggcaat tgctgcatgt 2020 

<210> 49<211> 2040<212> DNA<213> CORONAVIRUS<400> 49 

agcatttcca gcctgaagac gtactgtagc agctaaactg cccagcacca tacctctatt 60 

taggttgttt aagcctttga tgaagtacaa gtatttcact ttaggccctt ttggtgtgtc 120 

tgtaacaaac ctacaaggtg gttccagttc tgtgtaaatt gtacctgtac catcactctt 180 

agggaatcta gcccatttga gatcttggtg gtctgatagt aatgccagca caaacctacc 240 

tcccttcgaa ttgttatagt aggcaagtgc attgtcatca gtacaagctg tttgtgtggt 300 

accagccgca caggacatct gtcgtagtgc tactggactc agttcattat tctgtagttt 360 

aacagctgag ttggctctta gagctgtaac aataagaggc caagccaaat ttggtgaatt 420 

gtccatgtta atrtcactaa gttgaacaat cttgctatcc gcatcaacaa cttgctggat 480 

ttcccagagt gcagatgcat atgtaaaggt gttaccatca caagtgttct tgtaggtacc 540 

ataatcaggg acaacaacca tgagtttggc tgctgtagtc aatggtatga tgttgagtgg 600 

aacacaacca tcacgcgcat tgttgataat gttgttaagt gcatcattat caagcttcct 660 

aagcatagtg aagagcattg tttgcatagc actagttact tttgccctct tgtcctcaga 720 

trcttgcctgt ttgtacattt gggtcatagc ctgatctgcc atcttttcca acttgcgttg 780 

catggcagca tcacggtcaa actcagattt agccacattc aaagatttct ttaacttttt 840 

gagaacgact tcagaatcac cattagctac agcctgctca taggcctcct gggcagtggc 900 

ataagcggca tatgatggta aagaactaaa ttctgaagca atagcctgaa gagtagcacg 960 

gttatcgagc atttcctcgc acaacctatt aatgtctaca gcaccctgca tggatagcaa 1020 

aacagacaaa agagaaacca tcttctcgaa agcttcagtt gtgtcttttg caagaagaat 1080 

atcattgtgg agttgtacac attgtgccca caatttagaa gatgactcta ctctaagttg 1140 

ttgaagaacc gagagcagta ccacagatgt gcactttacg tcagacattt tagactgtac 1200 

agtagcaacc ttgatacatg gtttacctcc aatacccaac aacttaatgt taagcttgaa 1260 

agcatcaata ctactcttag gaggcaaaag cccctgggag ttcatatacc taaattxttg 1320 

tgtagagacc aagtagtcat aaacaccaag agtaagcctg aagtaacggt tgagtaaaca 1380 

gaaaaggcca aagtagcagc agcaacaata gcctaagaaa caataaacaa gcatgataca 1440 

ctgtaaggtg ttgccagtaa taaataacaa tgggtaatac tcaacacaca caaacactat 1500 

agctctagct aaaaacatga tagtcgtaac gacaccagaa tagttagagg ttacagaaat 1560 

aactaaggcc cacatggaaa tagcttgatc taaagcatta ccatagtaga ctttgtaaac 1620 

aagtgtaatg acattcatca gtgtccaaac acgtctagca gcatcatcat aaacagtgcg 1680 

agctgtcatg agaataagca aaactaaagc tgaagcatac ataacacaat ccttaagcct 1740 

ataaccagac aagctagtgt cagccaattc aagccatgtc atgatacgca tcacccagct 1800 

agcaggcatg tagaccatat taaagtaagc aactgttgca agagaaggta acagaaacaa 1860 

gcacaagaat gcgtgcttat gcttaacaag cagcatagca catgcagcaa ttgccataat 1920 
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S226CAS111.ST25 
accaagagta aatggcaaga aagcattctc gtaaacaaag aaaaacagtg 

actttgaaca agaatcaata gtgatgtcaa gaaagttaaa agcatccaat 

^210> 50<211> 2012<212> DNA<213> CORONAVIRUS<400> 
cttgtaggtt tgttacagac acaccaaaag ggcctaaagt gaaatacttg 



accactgtgt 
gatgagtgca 



50 

tacttcatca 



aaggcttaaa caacctaaat agaggtatgg tgctgggcag tttagctgct 
ttcaggctgg aaatgctaca gaagtacctg ccaattcaac tgtgctttcc 
ttgcagtaga ccctgctaaa gcatataagg attacctagc aagtggagga 
ccaactgtgt gaagatgttg tgtacacaca ctggtacagg acaggcaatt 
cagaagctaa catggaccaa gagtcctttg gtggtgcttc atgttgtctg 
gccacattga ccatccaaat cctaaaggat tctgtgactt gaaaggtaag 
tacctaccac ttgtgctaat gacccagtgg gttttacact tagaaacaca 
tctgcggaat gtggaaaggt tatggctgta gttgtgacca actccgcgaa 
agtctgcgga tgcatcaacg tttttaaacg ggtttgcggt gtaagtgcag 
accgtgcggc acaggcacta gtactgatgt cgtctacagg gcttttgata 
aaaagttgct ggttttgcaa agttcctaaa aactaattgc tgtcgcttcc 
tgaggaaggc aatttattag actcttactt tgtagttaag aggcatacta 
ccaacatgaa gagactattt ataacttggt taaagattgt ccagcggttg 
ctttttcaag tttagagtag atggtgacat ggtaccacat atatcacgtc 
taaatacaca atggctgatt tagtctatgc tctacgtcat tttgatgagg 
tacattaaaa gaaatactcg tcacatacaa ttgctgtgat gatgattatt 
ggattggtat gacttcgtag agaatcctga catcttacgc gtatatgcta 
gcgtgtacgc caatcattat taaagactgt acaattctgc gatgctatgc 
cattgtaggc gtactgacat tagataatca ggatcttaat gggaactggt 
tgatttcgta caagtagcac caggctgcgg agttcctatt gtggattcat 
gctgatgccc atcctcactt tgactagggc attggctgct gagtcccata 
tctcgcaaaa ccacttatta agtgggattt gctgaaatat gattttacgg 
ttgtctcttc gaccgttatt ttaaatattg ggaccagaca taccatccca 
ctgtttggat gataggtgta tccttcattg tgcaaacttt aatgtgttat 
gtttccacct acaagttttg gaccactagt aagaaaaata tttgtagatg 
tgttgtttca actggatacc attttcgtga gttaggagtc gtacataatc 
cttacatagc tcgcgtctca gtttcaagga acttttagtg tatgctgctg 
gcatgcagct tctggcaatt tattgctaga taaacgcact acatgctttt 
actaacaaac aatgttgctt ttcaaactgt caaacccggt aattttaata 
tgactttgct gtgtctaaag gtttctttaa ggaaggaagt tctgttgaac 
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acagtacgtc 
ttctgtgctt 
caaccaatca 
actgtaacac 
tattgtagat 
tacgtccaaa 
gtctgtaccg 
cccttgatgc 
cccgtcttac 
tttacaacga 
aggagaagga 
tgtctaacta 
ctgtccatga 
agcgtctaac 
gtaattgtga 
tcaataagaa 
acttaggtga 
gtgatgcagg 
acgatttcgg 
attactcatt 
tggatgctga 
aagagagact 
attgtattaa 
tttctactgt 
gtgttccttt 
aggatgtaaa 
atccagctat 
cagtagctgc 
aagactttta 
taaaacactt 



1980 
2040 

60 
120 
180 
240 
300 
360 
.420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 



1er depot 



S226CAS111.ST25 _- n 
cttctttgct caggatggca acgctgctat cagtgattat gactattatc gttataatct 1920 

gccaacaatg tgtgatatca gacaactcct attcgtagtt gaagttgttg ataaatactt 1980 

2012 

tgattgttac gatggtggct gtattaatgc ca 

gcgtttctgc tgcgaaaagc ttgagtctct cagtacaagt gttggcaagt atgtaatcgc 
cagcattagt ccaatcacat gttgctatcg cattgaagtc agtgacattg tcactgccta 
cacatgtgtt tttgtataaa ccaaaaacct gaccattagc acataatgga aaactaatgg 
gaggcttatg tgacttgcaa taatagctca tacctcctag atacagttgt gtcacatcag 
tgacatcaca acctggggca ttgcaaacat agggattaac agacaacact aatttgtgtg 
atgttgaaat gacatggtca tagcagcact tgcaacatag gaatggtctc ctaatacagg 
caccgcaacg aagtgaagtc tgtgaattgc acaatacaca agcacctaca gcctgcaaga 
ctgtatgtgg tgtgtacata gcctcataaa actcaggttc ccagtaccgt gaggtgttat 
cattagttag cattacggaa tacatgtcca acatgtggcc agtaagctca tcatgtaact 
ttctaatgta ttgtaaatac aagtgaaaga catcagcata ctcctgatta ggatgttttg 
taagtgggta agcatcaata gccagtgaca cgaacctttc aatcataagt gtaccatctg 
ttttgacaat atcatcgaca aaacagcctg cgcctaatat tcttgatgga tctgggtaag 
gcaggtacac gtaatcatct ccttgtttaa ctagcattgt atgctgtgag caaaattcgt 
gaggtccttt agtaaggtca gtctcagtcc aacattttgc ctcagacatg aacacattat 
tttgataata aagaactgcc ttaaagttct taatgctagc tactaaacct tgagccgcat 
agttactgtt atagcacaca acggcatcat cagaaagaat catcatggag aaatgtttac 
gcaggtaagc gtaaaactca tccacgaatt catgatcaac atccctattt ctatagagac 
actcatagag cctgtgttgt agattgcgga catacttgtc agctatctta ttaccatcag 
ttgaaagaag tgcatttaca ttggctgtaa cagcttgaca aatgttaaag acactattag 
cataagcagt tgtagcatca ccggatgatg ttccacctgg tttaacatat agtgagccgc 
cacacatgac catctcactt aatacttgcg cacactcgtt agctaacctg tagaaacggt 
gtgataagtt acagcaagtg ttatgtttgc gagcaagaac aagagaggcc attatcctaa 
gcatgttagg catggctctg tcacattttg gataatccca acccataagg tgtggagttt 
ctacatcact gtaaacagtt tttaacatat tatgccagcc accgtaaaac ttgcttgttc 
caattaccac agtagctcct ctagtggcgg ctattgactt caataatttc tgatgaaact 
gtctatttgt catagtacta cagatagaga caccagctac ggtgcgagct ctattctttg 
cactaatggc atacttaaga ttcatttgag ttatagtagg gatgacatta cgcttagtat 
acgcgaaaag tgcatcttga tcctcataac tcattgagtc ataataaagt ctagccttac 
cccatttatt aaatgggaaa ccagctgatt tatccagatt gttaacgatt acttggttgg 
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120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
168C 
174C 
180C 



S226CAS111.ST25 1CAft 
cattaataca gccaccatcg taacaatcaa agtatttatc aacaacttca actacgaata I860 

1877 

ggagttgtct gatatca 

->ir, i;?^911-> 2051<212> DNA<213> CORONAVIRUS<400> 52 
JcagStccaftStgacil; giact?catt gatgtaagct caaagccatg cgcccaaagg 

acgaacacga ctctgtctga caatcctttc agtgtatcac tgagcatttg tactatctta 
atacgcacta cattccaggg caagccttta tacatgagtg gtataagatg tttaaactgg 
tcacctggtg gaggttttgc attaactctg gtgaattctg tgttattttc agtgtcaaca 
taaccagtcg gtacagctac taagttaaca cctgtagaaa atcctagctg gagaggtagg 
ttagtaccca cagcatctct agttgcatga cagccctcta catcaaagcc aatccacgca 
cgaacgtgac gaatagcttc ttcgcgggtg ataaacatat tagggtaacc attgacttgg 
taattcattt tgaaacccat catagagatg agtctacggt aggtcatgtc ctttggtatg 
cctggtatgt caacacataa tccttcagtc ttgaacttta tatcaacgct gaggtgtgta 
ggtgcctgtg taggatgaag accagtaatg atcttactac agtccttaaa aagtccagtt 
acattttctg cttgtaatgt agccacattg cgacgtggta tttctagact tgtaaattgc 
agtttgtcat aaagatctct atcagacatt atgcacaaaa tgccaatttt tgcccttgtg 
atagccacat tgaagcggtt gacattacaa gagtgtgctg tttcagtagt ttgtgtgaat 
atgacatagt catattcaga accctgtgat gaatcaacag tctgcgtagg caatcctaag 
atttttgaag ctacagcgtt ctgtgaatta taaggtgaga taaaaacagc ttttctccaa 
gcaggattgc gtgtaagaaa ttctcttaca acgcctattt gaggtctgtt gattgcagat 
gaaacatcat gtgtaataac acctttgtag aacattttga agcattgagc tgacttatcc 
ttgtgtgctt ttagcttatt gtcataaact aaagcactca cagtgtcaac aatttcagca 
ggacaacggc gacaagttcc aaggaacatg tctggaccta ttgttttcat aagtctgcac 
actgaattaa aatattctgg ttctagtgtg cctttagtca gcaatgtgcg gggggctggt 
aattgagcag gatcgccaat atagacgtag tgttttgcac gaagtctagc attgacaaca 
ctcaagtcat aattagtagc catagagatt tcatcaaaga ctacaatgtc agcagttgtt 
tctggcaatg catttacagt gcagaaaaca tactgttcta gtgttgaatt cactttgaat 
ttatcaaaac actctacgcg cgcacgcgca ggtatgattc tactacattt atctatgggc 
aaatatttta atgccttttc acatagggca tcaacagctg catgagagca tgccgtatac 
actatgcgag cagatgggta atagagagca agtccgatgg caaaatgact cttaccagta 
ccaggtggtc cttggagtgt agagtacttt tgcatgccga ccttttgata atttgcaaca 
ttgctagaaa actcatctga gatgttgagt gttgggtaca agccagtaat tctcacatag 
tgctcttgtg gcactagagt aggtgcacta agtggcatta cagtgtgaga tgtcaacaca 
aagtaatcac caacattcaa cttgtatgtc gtagtacctc tgtacacaac agcatcacca 
tagtcacctt tttcaaaggt gtactctcca atctgtactt tactattttt agttacacgg 
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taaccagtaa agacatagtt tctgttcaat ggtggtctag gttttccaac ctcccatgaa 1920 

agatgcaatt ctctgtcaga gagtacttcg cgtacagtgg caataccata tgacagctta 
aatgtttcct cagtggcttt gagcgtttct gctgcgaaaa gcttgagtct ctcagtacaa 
gtgttggcaa g 

-»in^ 2075<212> DNA<213> CORONAVIRUS<400> 53 

ScttgtSgt 2 t«ggg?aga aggtttcaac atgtccatcc ttacaccaaa gcatgaatga 60 

aatttcagca tagtcaattg taaccttgac cacttttgaa atcactgaca aatcttgtga 
ctttattatc tcgacaaagt catcaagtaa aagatcaatc acagaacaca cacattttga 
tgaacctgtt tgcgcatctg ttatgaagta atttttcact gtgctgtcca tagggataaa 
atcctctaat ttaagtggtg aatcttgtga gcgcttggct aagcctatca ttaaatgaag 
accgccaagt tgtccatgac tgaaatctcc ataaacgatg tgttcgaagg catagccctc 
gagcttatat cgctgtatga attcatccat agcgagctcg agaaagtcag tttccatttg 
tgatctgggc ttaaaatcct ctaagtctct gctctgagta aagtaggttt caggcaactg 
ttgaataatg ccgtctactt tcttaaagta gttaaactgt gtttttactg attctccaat 
taatgtgact ccattgacgc tagcttgtgc tggtcccttt gaaggtgtta gacctttgac 
tgaaccttct gttattaaaa caccattacg ggcgtttcta aaaaggtcta cctgtccttc 
cactctacca tcaaacaaga cagtaagtga agaacaagca ctctcagtag gtttcttggc 
aatgtcagtc attgtgcaga cacctattgt agatacatgt gctggggctt ctcttttgta 
gtcccagatt acagtattag cagcgatatc aacacccaaa ttattgagta tcttaatctc 
tggcactggt ttaatgttac gcttagccca aagctcaaat gcaacattaa caggaagtgt 
tgtcttattt tcaaagatct ccacatcaat accatctacc tttgtgtaaa cagcattatt 
aatgatggaa acaggtgctt cgccggcgtg tccatcaaag tgtcctttat taacaacatt 
ataagccaca ttttctaaac tctgtaacct ggtaaatgta ttccacaggt tataagtatc 
aaattgtttg taaatccata ggctaaatcc agcagaaatc atcatattat atgcatccaa 
gtactgtcgg tactcatttg catggtgtct gcaaacagca ccacctaaat tgcatcgtgt 
aatacacgta gcagatttga gtggaacata atcaatatcc gacactactt gtttgccatg 
agactcacaa ggactatcag aatagtaaaa gaaaggcaat tgctttaaat tagtaaatgc 
acttttatcg aaagctggag tgtggaatgc atgcttattc acatacaaac taccaccatc 
acagcctggt aagttcaagt ttgacaagac tcttgtgtca aacctacaca caattgcatt 
ggctgggtaa cgatcaacgt tacaattcca aaacaaacaa acaccatcag tgaatttatc 
gtgatgtgta gcataagaat agaagagttc ctctattttg taagctttgt cactacatgg 
ctgagcatcg tagaacttcc attctacttc agcctgaggc acacacttga tagcctttgg 
atttccaatg tcatgaagaa ctggaaactt atcagcaagc aatgcagact tcacaaccat 
gtgttgtact tttctgcaag cagaattaac cctcagttca tctcctataa tagggtattc 
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aacagaccaa tcaacgcgct taacaaagca ctcatggact gctaaacatc tagtcatgat 1800 

agcatcacaa ctagccacat gtgcatttcc atgtacctgg caatgttggt catggttact 1860 

ctgaaggtta cccgtaaagc cccactgctg aacatcaatc ataaatgggt tatagacata 1920 

gtcaaaaccc acagaatgat tccagcaggc ataagtatct gatgaagtag aaaagcaagt 1980 

tgcacgtttg tcacacagac aacacgttxt ttcaggtcca atcttgacaa agtacttcat 2040 

tgatgtaagc tcaaagccat gcgcccaaag gacga 2075 

<210> 54<211> 1891<212> DNA<213> CORONAVIRUS<400> 54 

aagattcacc acttaaatta gaggatttta tccctatgga cagcacagtg aaaaattact 60 

tcataacaga tgcgcaaaca ggttcatcaa aatgtgtgtg ttctgtgatt gatcttttac 120 

ttgatgactt tgtcgagata ataaagtcac aagatttgtc agtgatttca aaagtggtca 180 

aggttacaat ugactatgct gaaatttcat tcatgctttg gtgtaaggat ggacatgttg 240 

aaaccttcta cccaaaacta caagcaagtc aagcgtggca accaggtgtt gcgatgccta 300 

acttgtacaa gatgcaaaga atgcttcttg aaaagtgtga ccttcagaat tatggtgaaa 360 

atgctgttat accaaaagga ataatgatga atgtcgcaaa gtatactcaa ctgtgtcaat 420 

acttaaatac acttacttta gctgtaccct acaacatgag agttattcac tttggtgctg 480 

gctctgataa aggagttgca ccaggtacag ctgtgctcag acaatggttg ccaactggca 540 

cactacttgt cgattcagat cttaatgact tcgtctccga cgcagattct actttaattg 600 

gagactgtgc aacagtacat acggctaata aatgggacct tattattagc gatatgtatg 660 

accctaggac caaacatgtg acaaaagaga atgactctaa agaagggttt ttcacttatc 720 

tgtgtggatt tataaagcaa aaactagccc tgggtggttc tatagctgta aagataacag 780 

agcattcttg gaatgctgac ctttacaagc ttatgggcca tttctcatgg tggacagctt 840 

ttgttacaaa tgtaaatgca tcatcatcgg aagcattttt aattggggct aactatcttg 900 

gcaagccgaa ggaacaaatt gatggctata ccatgcatgc taactracatt ttctggagga 960 

acacaaatcc tatccagttg tcttcctatt cactctttga catgagcaaa tttcctctta 1020 

aattaagagg aactgctgta atgtctctta aggagaatca aatcaatgat atgatttatt 1080 

ctcttctgga aaaaggtagg cttatcatta gagaaaacaa cagagttgtg gtttcaagtg 1140 

atattcttgt taacaactaa acgaacatgt ttattttctt attatttctt actctcacta 1200 

gtggtagtga ccttgaccgg tgcaccactt trtgatgatgt tcaagctcct aattacactc 1260 

aacatacttc atctatgagg ggggtttact atcctgatga aatttttaga tcagacactc 1320 

tttatttaac tcaggattta tttcttccat tttattctaa tgttacaggg tttcatacta 1380 

ttaatcatac gtttggcaac cctgtcatac cttttaagga tggtatttat tttgctgcca 1440 

cagagaaatc aaatgttgtc cgtggttggg tttttggttc taccatgaac aacaagtcac 1500 

agtcggtgat tattattaac aattctacta atgttgttat acgagcatgt aactttgaat 1560 

tgtgtgacaa ccctttcttt gctgtttcta aacccatggg tacacagaca catactatga 1620 

Page 73 



1er depot 



S226CAS111.ST25 

tattcgataa tgcatttaat tgcactttcg agtacatatc tgatgccttt tcgcttgatg 1680 

tttcagaaaa gtcaggtaat tttaaacact tacgagagtt tgtgtttaaa aataaagatg 1740 

ggtttctcta tgtttataag ggctatcaac ctatagatgt agttcgtgat ctaccttctg 1800 

gttttaacac tttgaaacct atttttaagt tgcctcttgg tattaacatt acaaatttta 1860 

gagccattct tacagccttt tcacctgctc a 1891 

<210> 55<211> 32<212> DNA<213> ARTIFICIAL SEQUENCE<220><223> amorce N sens 
<400> 55 

cccatatgtc tgataatgga ccccaatcaa ac 32 

<210> 56<211> 32<212> DNA<213> artificial sequence<220><223> amorce N 
anti sens 

<400> 56 

cccccgggtg cctgagttga atcagcagaa gc 32 

<210> 57<211> 31<212> DNA<213> artificial sequence<220><223> amorce Sc sens 
<400> 57 

cccatatgag tgaccttgac cggtgcacca c 31 

<210> 58<211> 30<212> DNA<213> artificial sequence<220><223> amorce SL sens 
<400> 58 

cccatatgaa accttgcacc ccacctgctc 30 

<210> 59<211> 33<212> DNA<213> amorce Sc et SL anti sens<400> 59 
cccccgggtt taatatattg ctcatatttt ccc 33 

<210> 60<211> 16<212> DNA<213> amorce sens serie 1<400> 60 
ggcatcgtat gggttg 16 

<210> 61<211> 16<212> DNA<213> amorce anti sens serie 2 (28774-28759)<400> 
61 

cagtttcacc acctcc 16 

<210> 62<211> 16<212> dna<213> amorce sens serie 2 (28375-28390) <400> 62 
ggctactacc gaagag 16 

<210> 63<211> 16<212> DNA<213> amorce anti sens serie 2 (28702-28687)<400> 
63 

aattaccgcg actacg 16 

<210> 64<211> 26<212> DNA<213> sonde 1/serie 1 (28561-28586)<400> 64 
ggcacccgca atcctaataa caatgc 26 

<210> 65<211> 21<212> DNA<213> sonde 2/serie 1 (28588-28608) <400> 65 
gccaccgtgc tacaacttcc t 21 

<210> 66<211> 23<212> DNA<213> sonde 1/serie 2 /sonde N/FL 
(28541-28563) <400> 66 
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atacacccaa agaccacatt ggc 23 

<210> 67<211> 25<212> DNA<213> sonde 2/serie 2/sonde SARS/N/LC705 
(28565-28589)<400> 67 

cccgcaatcc taataacaat gctgc 25 

<210> 68<211> 30<212> DNA<213> artificial sequence<220><223> amorce ancre 
14T 

<400> 68 

agatgaattc ggtacctttt tttttttttt 30 

<210> 69<211> 13<212> PRT<213> artificial sequence<220><223> peptide M2-14 
<400> 69 

Ala Asp Asn Gly Thr He Thr Val Glu Glu Leu Lys Gin 
15 10 

<210> 70<211> 12<212> PRT<213> artificial sequence<220><223> peptide El-12 
<400> 70 

Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu 
15 10 

<210> 71<211> 24<212> PRT<213> artificial sequence<220><223> peptide £53-72 
<400> 71 

Lys Pro Thr Val Tyr val Tyr Ser Arg val Lys Asn Leu Asn Ser ser 
15 10 15 

Glu Gly Val Pro Asp Leu Leu Val 
20 

<210> 72<211> 153<212> ONA<213> CORONAVIRUS<400> 72 

gatattaggt ttttacctac ccaggaaaag ccaaccaacc tcgatctctt gtagatctgt 60 

tctctaaacg aactttaaaa tctgtgtagc tgtcgctcgg ctgcatgcct agtgcaccta 120 

cgcagtataa acaataataa attttactgt cgt 153 

<210> 73<211> 410<212> DNA<213> CORONAVIRUS<400> 73 

ttctccagac aacttcaaaa ttccatgagt ggagcttctg ctgattcaac tcaggcataa 60 

acactcatga tgaccacaca aggcagatgg gctatgtaaa cgttttcgca attccgttta 120 

cgatacatag tctactcttg tgcagaatga attctcgtaa ctaaacagca caagtaggtt 180 

tagttaactt taatctcaca tagcaatctt taatcaatgt gtaacattag ggaggacttg 240 

aaagagccac cacattttca tcgaggccac gcggagtacg atcgagggta cagtgaataa 300 

tgctagggag agctgcctat atggaagagc cctaatgtgt aaaattaatt ttagtagtgc 360 

tatccccatg tgattttaat agcttcttag gagaatgaca aaaaaaaaaa 410 

<210> 74<211> 4382<212> PRT<213> CORONAVIRUS<400> 74 
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Met Glu Ser Leu val Leu Gly val Asn Glu Lys Thr His Val Gin Leu 
1 5 10 15 

ser Leu Pro Val Leu Gin val Arg Asp val Leu val Arg Gly Phe Gly 
20 25 30 

Asp ser val Glu Glu Ala Leu ser Glu Ala Arg Glu His Leu Lys Asn 
35 40 45 

Gly Thr cys Gly Leu Val Glu Leu Glu Lys Gly val Leu Pro Gin Leu 
50 55 60 

Glu Gin Pro Tyr Val Phe lie Lys Arg ser Asp Ala Leu Ser Thr Asn 
65 70 75 80 

His Gly His Lys val val Glu Leu Val Ala Glu Met Asp Gly lie Gin 
85 90 95 

Tyr Gly Arg ser Gly lie Thr Leu Gly val Leu val Pro His Val Gly 
100 105 110 

Glu Thr Pro lie Ala Tyr Arg Asn val Leu Leu Arg Lys Asn Gly Asn 
115 120 125 

Lys Gly Ala Gly Gly His ser Tyr Gly lie Asp Leu Lys ser Tyr Asp 
130 135 140 

Leu Gly Asp Glu Leu Gly Thr Asp Pro lie Glu Asp Tyr Glu Gin Asn 
145 150 155 160 

Trp Asn Thr Lys His Gly ser Gly Ala Leu Arg Glu Leu Thr Arg Glu 
165 170 175 

Leu Asn Gly Gly Ala val Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly 
180 185 190 

Pro Asp Gly Tyr Pro Leu Asp Cys lie Lys Asp Phe Leu Ala Arg Ala 
195 200 205 

Gly Lys ser Met Cys Thr Leu ser Glu Gin Leu Asp Tyr lie Glu Ser 
210 215 220 

Lys Arg Gly Val Tyr Cys Cys Arg Asp His Glu His Glu lie Ala Trp 
225 230 235 240 

Phe Thr Glu Arg Ser Asp Lys Ser Tyr Glu His Gin Thr Pro Phe Glu 
245 250 255 

He Lys Ser Ala Lys Lys Phe Asp Thr Phe Lys Gly Glu cys Pro Lys 
260 265 270 
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» Cfl r i« val lvs val lie Gin Pro Arg val 
Phe val Phe Pro Leu Asn ser Lys Val Lys va 2g5 



G1 „ Lys Lys Lys Thr 0 1U g y Phe Met c!y Ar, lie Arg ser Va! Tyr 
290 

Gin Glu cys Asn Asn Met His Leu ser Thr Leu 
310 31!> 

Met Lys cys Asn His cys Asp Glu val ser Trp Gin Thr cys Asp Phe 
A la Thr cys Glu His cys Glv Thr Glu Asn Leu Val He Glu 

Thr Asn Ala val val Lys Met 
365 

Pro cys Pro Ala cys «l. Asp Pro clu Xie P™ *« ~r val 
370 3/:> 

Ala Asp Tyr His Asn His ser Asn xl. «l. Thr Arg Leu Arg Lys Gly, 
385 390 

G ly Arg Thr Arg cys Phe Gly Gly cys val Phe Ala Tyr val Gly cys 



Pro val Ala ser Pro Gin eiu ^y=> ~»» — ^ 
305 * 1U 



Leu Lys Ala Tnr cys v,,u w- 

G ly P ro Thr Thr cys Gly Tyr Leu pro Tnr ash ... 
355 



405 



^r Asn Lys jrj Ala Tyr Trp va! Pro Arg Ala ser Aia .«g Tie Gly. 

ser Oly His Thr Gly Tie Thr Gly Asp Asn va! Glu Thr Leo Asn Glu 

ASP Leo Leo Glu lie Leo ser Arg Glu Arg vai Asn lie Asn xie vai 
450 4b:> 

G 1y Asp Phe His Leu Asn Glu do va! Ala Tie lie Leo Ala ser %e 
465 47U 



ser Aia ser Thr ser Ala Phe xie Asp Thr xie Lys ser Leu Asp Tyr 
L ys ser Phe Lys Thr xie val CI. gr cys fly Asn Tyr Lys val Thr 
L ys G ly Lys Pro val Lys sly Ala Trp Asn xie oly Gin Gin Arg ser 
val Leu Thr Pro Leu cys Gly Phe Pro ser cln Ala Ala Gly val xie 



530 
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Arg ser He Phe Ala Arg Thr Leu Asp Ala Ala Asn His Ser He Pro 

Asp Leu Gin Arg Ala Ala Val Thr He Leu Asp Gly He ser Glu Gin 

Ser Leu Arg Leu Val Asp Ala Met Val Tyr Thr Ser Asp Leu Leu Thr 
580 

Asn ser val He lie Met Ala Tyr Val Thr Gly Gly Leu val Gin Gin 
595 600 ou:> 

Thr ser Gin Trp Leu ser Asn Leu Leu Gly Thr Thr val Glu Lys Leu 
610 615 ° 

Arg Pro He Phe Glu Trp He Glu Ala Lys Leu Ser Ala Gly val Glu 
625 630 G 

Phe Leu Lys Asp Ala Trp Glu He Leu Phe Leu He Thr Gly val 

Phe Asp He val Lys Gly Gin He Gin Val Ala ser Asp Asn He Lys 
660 

Asp cys Val Lys cys Phe He Asp val val Asn Lys Ala Leu Glu Met 

cys He Asp Gin Val Thr He Ala Gly Ala Lys Leu Arg Ser Leu Asn 
690 695 

Leu Gly Glu Val Phe He Ala Gin ser Lys Gly Leu Tyr Arg Gin cys 
705 710 

He Arg Gly Lys Glu Gin Leu Gin Leu Leu Met Pro Leu Lys Ala Pro 



725 



Lys Glu val Thr Phe Leu Glu Gly Asp ser His Asp Thr val Leu Thr 
740 745 

ser Glu Glu val val Leu Lys Asn Gly Glu Leu Glu Ala Leu Glu Thr 
755 760 /eo 

Pro val Asp ser Phe Thr Asn Gly Ala He val Gly Thr Pro Val Cys 
770 775 

val Asn Gly Leu Met Leu Leu Glu He Lys Asp Lys Glu Gin Tyr cys 
785 7 9° /yi 

Ala Leu ser Pro Gly Leu Leu Ala Thr Asn Asn val Phe Arg Leu Lys 
805 ° 1U 
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Gly Gly Ala Pro lie Lys Gly Val Thr Phe Gly Glu Asp Thr Val Trp 
820 825 830 

Glu val Gin Gly Tyr Lys Asn Val Arg lie Thr Phe Glu Leu Asp Glu 
835 840 845 

Arg val Asp Lys val Leu Asn Glu Lys Cys Ser val Tyr Thr Val Glu 
850 855 860 

Ser Gly Thr Glu val Thr Glu Phe Ala cys val val Ala Glu Ala val 
865 870 875 880 

Val Lys Thr Leu Gin Pro Val ser Asp Leu Leu Thr Asn Met Gly He 
885 890 895 

Asp Leu Asp Glu Trp Ser Val Ala Thr Phe Tyr Leu Phe Asp Asp Ala 
900 905 910 

Gly Glu Glu Asn Phe ser ser Arg Met Tyr Cys ser Phe Tyr pro Pro 
915 920 925 

Asp Glu Glu Glu Glu Asp Asp Ala Glu Cys Gl u Glu Glu Glu lie Asp 
930 935 . 940 

Glu Thr Cys Glu His Glu Tyr Gly Thr Glu Asp Asp Tyr Gin Gly Leu 
945 950 955 960 

Pro Leu Glu Phe Gly Ala ser Ala Glu Thr val Arg Val Glu Glu Glu 
965 970 975 

Glu Glu Glu Asp Trp Leu Asp Asp Thr Thr Glu Gin Ser Glu lie Glu 
980 985 990 

Pro Glu Pro Glu pro Thr Pro Glu Glu Pro val Asn Gin Phe Thr Gly 
995 1000 1005 

Tyr Leu Lys Leu Thr Asp Asn Val Ala lie Lys cys val Asp lie 
1010 1015 1020 

Val Lys Glu Ala Gin Ser Ala Asn pro Met Val lie Val Asn Ala 
1025 1030 1035 

Ala Asn lie His Leu Lys His Gly Gly Gly Val Ala Gly Ala Leu 
1040 1045 1050 

Asn Lys Ala Thr Asn Gly Ala Met Gin Lys Glu ser Asp Asp Tyr 
1055 1060 1065 

lie Lys Leu Asn Gly Pro Leu Thr Val Gly Gly Ser Cys Leu Leu 
1070 1075 1080 
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ser Gly His Asn Leu Ala Lys Lys cys Leu His yal Val Gly pro 
1085 1090 

Asn Leu Asn Ala Gly Glu Asp He Gin Leu Leu Lys Ala Ala Tyr 
1100 1105 Xi u 

Glu Asn Phe Asn Ser Gin Asp He Leu Leu Ala Pro Leu Leu ser 
1115 1120 X1 

Ala Gly He Phe Gly Ala Lys Pro Leu Gin Ser Leu Gin val Cys 
1130 H35 J-J-W 

Val Gin Thr val Arg Thr Gin val Tyr lie Ala val Asn Asp Lys 
1145 1150 

Ala Leu Tyr Glu Gin Val val Met Asp Tyr Leu Asp Asn Leu Lys 
1160 H65 11/u 

Pro Arg Val Glu Ala Pro Lys Gin Glu Glu Pro Pro Asn Thr Glu 
H75 1180 1115 ■> 

Asp Ser Lys Thr Glu Glu Lys^ ser Val Val Gin Lys Pro val Asp 
1190 1195 !2UU 

val Lys Pro Lys He Lys Ala Cys He Asp Glu val Thr Thr Thr 
1205 1210 l ^ 

Leu Glu Glu Thr Lys Phe Leu Thr Asn Lys Leu Leu Leu Phe Ala 
1220 I 225 1 

Asp lie Asn Gly Lys Leu Tyr His Asp Ser Gin Asn Met Leu Arg 
1235 1240 -L^" 

Gly Glu Asp Met ser Phe Leu Glu Lys Asp Ala Pro Tyr Met Val 
1250 1255 12bU 

Gly Asp val He Thr ser Gly Asp lie Thr cys val Val lie Pro 
y 12(55 1270 1275 

ser Lys Lys Ala Gly Gly Thr Thr Glu Met Leu ser Arg Ala Leu 
1280 I 285 

Lys Lys val Pro Val Asp Glu Tyr He Thr Thr Tyr Pro Gly Gin 
1295 1300 

Gly Cys Ala Gly Tyr Thr Leu Glu Glu Ala Lys Thr Ala Leu Lys 
1310 1315 13ZO 

Lys cys Lys ser Ala Phe Tyr Val Leu Pro Ser Glu Ala Pro Asn 
1325 1330 1335 
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Ala Lys Glu Glu He Leu Glv Thr val sen Trp Asn Leu Arg Glu 
1340 1345 

Met Leu Ala His Ala Glu Glu Thr Arg Lys Leu Met Pro He cys 
1355 1360 X5K>:> 

Met Asp val Arg Ala He Met Ala Thr lie Gin Arg Lys Tyr Lys 
1370 1375 x3ou 

Gly He Lys lie Gin Glu Gly He Val Asp Tyr Gly val Arg Phe 
1385 1390 xsys 

Phe Phe Tyr Thr ser Lys Glu Pro val Ala ser lie He Thr Lys 
1400 I 405 X4iU 

Leu Asn ser Leu Asn Glu Pro Leu val Thr Met Pro lie Gly Tyr 
1415 1420 xtio 

val Thr His Gly Phe Asn Leu Glu Glu Ala Ala Arg Cys Met Arg 
1430 1435 J- 4W 

Ser Leu Lys Ala Pro Ala val Val ser val Ser ser Pro Asp Ala 
1445 1450 3 

val Thr Thr Tyr Asn Gly Tyr Leu Thr ser Ser Ser Lys Thr Ser 
1460 1465 ■ L4/u 

Glu Glu His Phe val Glu Thr val ser Leu Ala Gly Ser Tyr Arg 
1475 1480 1485 

Asp Trp Ser Tyr ser Gly Gin Arg Thr Glu Leu Gly val Glu Phe 
1490 1495 x^uu 

Leu Lys Arg Gly Asp Lys lie Val Tyr His Thr Leu Glu Ser Pro 
1505 1510 j-dxd 

val Glu Phe His Leu Asp Gly Glu val Leu ser Leu Asp Lys Leu 
1520 1525 1530 

Lys ser Leu Leu Ser Leu Arg Glu val Lys Thr lie Lys val Phe 
1535 1540 • L - >, *- > 

Thr Thr val Asp Asn Thr Asn Leu His Thr Gin Leu val Asp Met 
1550 1555 i:>fc,u 

ser Met Thr Tyr Gly Gin Gin Phe Gly Pro Thr Tyr Leu Asp Gly 
1565 1570 "'^ 

Ala Asp val Thr Lys He Lys Pro His Val Asn His Glu Gly Lys 
1580 1585 I 590 

page 81 



1er depot 



S226CAS111.ST25 

THr Phe Phe val Leu Pro Sen Asp Asp Tnr Leu ser <!. AT 
1595 1600 

Phe G!u Tyr Tyr His Thr Leu Asp «l. ser Phe Le^ Gly Arg Tyr 
1610 161b 

K ser. Ala Leu Asn His Th^ Lys Lys Trp Lys Jta Pro Gin Val 



1625 



fly Glv. Leu Thr ser He Lys $ Trp Ala Asp Asn Asn^ cys Tyr Leu 



1640 



ser ser val Leu Leu Ala Leu Gin Gin Leu Glu & Lys Phe Asn 
1655 1660 

Ala Pro Ala Leu Gin Glu Ala Tyr Tyr Arg Ala Arg^ Ala Gly Asp 
1670 1675 

A la Ala Asn Phe cys Ala Leu He Leu A!a Tyr sj^ Asn Lys Thr 



1685 



val Gly Glu Leu Gly Asp val Arg Glu Thr Met Th^ His Leu Leu 
1700 170b 

cln His A la Asn Leu Glu ser A!a Lys Arg val Leu,. Asn val val 
1715 1720 

cys Lys His cys Gly Gin Lys Thr Thr Thr Leu t*r Gly val Glu 
1730 1735 

Ala val Met Tyr Met Gly Thr Leu ser Tyr Asp As^ Leu Lys Thr 
1745 1750 

Gly val ser He Pro cys val cys Gly Arg Asp aU Thr Gin Tyr 
1760 1765 

L eu val Gin Gln Glu Ser Ser Phe Va! Met Met sgr Ala Pro Pro 
1775 1780 

rir, riv Thr Phe Leu cys Ala Asn Glu 
Ala Glu Tyr Lys Leu Gin Gin Gly Thr pne Le ^ 

1790 1795 

Tyr Thr Gly Asn Tyr Gin cys Gly His Tyr Thr His,. He Thr Ala 
1805 1810 

Lys Glu Thr Leu Tyr Arg lie Asp Gly Ala His Thr Lys Met 

1820 1825 

ser Glu Tyr Lys Gly Pro val Thr Asp val Phe jjr Lys Glu Thr 
1835 1840 
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Ser Tyr Thr Thr Thr lie Lys Pro Val Ser Tyr i_ys Leu Asp Gly 
1850 1855 1860 

Val Thr Tyr Thr Glu He Glu Pro Lys Leu Asp Gly Tyr Tyr Lys 
1865 1870 1875 

Lys Asp Asn Ala Tyr Tyr Thr Glu Gin Pro lie Asp Leu val Pro 
1880 1885 1890 

Thr Gin Pro Leu Pro Asn Ala Ser Phe Asp Asn Phe Lys Leu Thr 
1895 1900 1905 

Cys Ser Asn Thr Lys Phe Ala Asp Asp Leu Asn Gin Met Thr Gly 
1910 1915 1920 

Phe Thr Lys Pro Ala ser Arg Glu Leu ser Val Thr Phe Phe Pro 
1925 1930 1935 

Asp Leu Asn Gly Asp Val Val Ala lie Asp Tyr Arg His Tyr Ser 
1940 1945 1950 

Ala ser Phe Lys Lys Gly Ala Lys Leu Leu His Lys Pro lie Val 
1955 1960 1965 

Trp His lie Asn Gin Ala Thr Thr Lys Thr Thr Phe Lys Pro Asn 
. 1970 1975 1980 

Thr Trp Cys Leu Arg Cys Leu Trp Ser Thr Lys Pro val Asp Thr 
1985 1990 1995 

Ser Asn Ser Phe Glu val Leu Ala Val Glu Asp Thr Gin Gly Met 
2000 2005 2010 

Asp Asn Leu Ala Cys Glu Ser Gin Gin pro Thr ser Glu Glu Val 
2015 2020 2025 

Val Glu Asn Pro Thr lie Gin Lys Glu Val lie Glu cys Asp Val 
2030 2035 2040 

Lys Thr Thr Glu val Val Gly Asn Val lie Leu Lys Pro ser Asp 
2045 2050 2055 

Glu Gly val Lys val Thr Gin Glu Leu Gly His Glu Asp Leu Met 
2060 2065 2070 

Ala Ala Tyr val Glu Asn Thr ser lie Thr lie Lys Lys Pro Asn 
2075 2080 2085 

Glu Leu ser Leu Ala Leu Gly Leu Lys Thr lie Ala Thr His Gly 
2090 2095 2100 
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lle Ala Ala He Asn Ser val Pro Trp ser Lys lie Leu Ala Tyr 
2105 2110 

val LyS Q Pro Phe Leu Gly Gin.. Ala Ala He Thr Thr^ ser Asn Cys 

Ala Lys Arg Leu Ala Gin Arg Val Phe Asn Asn Tjr Met Pro Tyr 
2135 ZX4U 

val Phe Thr Leu Leu Phe Gin Leu Cys Thr Phe Thr Lys Ser Thr 
2150 2155 

Asn ser Arg He Arg Ala Ser Leu Pro Thr Thr lie Ala Lys Asn 
2165 2170 

ser val Lys ser Val Ala Lys Leu cys Leu Asp Ala Gly He Asn 
2180 2185 

Tyr val Lys ser Pro Lys Phe Ser Lys Leu Phe Thr He Ala Met 
2195 2200 " UJ 

Trp Leu Leu Leu Leu ser lie cys Leu Gly Ser Leu He cys Val 
2210 2215 

Thr Ala Ala Phe Gly Val Leu Leu ser Asn Phe Gly Ala Pro ser 
2225 2230 

Tyr cys Asn Gly val Arg Glu Leu Tyr Leu Asn Ser ser Asn val 
2240 2245 

Thr Thr Met Asp Phe cys Glu Gly ser Phe Pro cys ser He cys 
2255 2260 

Leu ser Gly Leu Asp Ser Leu Asp Ser Tyr Pro Ala Leu Glu Thr 
2270 2275 

XI e Gin val Thr lie Ser Ser Tyr Lys Leu Asp Leu Thr lie Leu 
2285 2290 

Gly Leu Ala Ala Glu Trp Val Leu Ala Tyr Met Leu Phe Thr Lys 
2300 2305 

Phe Phe Tyr Leu Leu Gly Leu Ser Ala He Met Gin val Phe Phe 
2315 2320 

Gly Tyr Phe Ala Ser His Phe lie ser Asn Ser Tro Leu Met Trp 
2330 2335 

Phe He He ser He val Gln^ Met Ala Pro Val ser Ala Met val 
2345 2350 
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Arq Met Tyr lie Phe Phe Ala ser Phe Tyr Tyr He Trp Lys Ser 
2360 2365 2370 

Tyr val His lie Met Asp Gly Cys Thr ser Ser Thr cys Met Met 
2375 2380 2385 

Cys Tyr Lys Arq Asn Arg Ala Thr Arg Val Glu Cys Thr Thr He 
2390 2395 " 2400 

Val Asn Gly Met Lys Arg Ser Phe Tyr val Tyr Ala Asn Gly Gly 
2405 2410 2415 

Arg Gly Phe Cys Lys Thr His Asn Trp Asn Cys Leu Asn Cys Asp 
2420 2425 2430 

Thr Phe cys Thr Gly Ser Thr Phe lie Ser Asp Glu val Ala Arg 
2435 2440 2445 

Asp Leu ser Leu Gin Phe Lys Arg pro lie Asn Pro Thr Asp Gin 
2450 2455 2460 

Ser ser Tyr lie Val Asp ser val Ala Val Lys Asn Gly Ala Leu 
2465 2470 2475 

His Leu Tyr Phe Asp Lys Ala Gly Gin Lys Thr Tyr Glu Arg His 
2480 2485 2490 

Pro Leu ser His Phe val Asn Leu Asp Asn Leu Arg Ala Asn Asn 
2495 2500 2505 

Thr Lys Gly ser Leu Pro lie Asn Val lie val Phe Asp Gly Lys 
2510 2515 2520 

Ser Lys cys Asp Glu Ser Ala ser Lys Ser Ala ser val Tyr Tyr 
2525 2530 2535 

Ser Gin Leu Met cys Gin Pro lie Leu Leu Leu Asp Gin Ala Leu 
2540 2545 2550 

Val Ser Asp Val Gly Asp ser Thr Glu val Ser Val Lys Met Phe 
2555 2560 2565 

Asp Ala Tyr val Asp Thr Phe ser Ala Thr Phe ser val Pro Met 
2570 2575 2580 

Glu Lys Leu Lys Ala Leu Val Ala Thr Ala His ser Glu Leu Ala 
2585 2590 2595 

Lys Gly Val Ala Leu Asp Gly val Leu Ser Thr Phe val ser Ala 
2600 2605 2610 
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Ala Arg Gin Gly Val val Asp Thr Asp Val Asp Thr Lys Asp val 
2615 2620 2625 

lie Glu cys Leu Lys Leu Ser His His ser Asp Leu Glu Val Thr 
2630 2635 2640 

Gly Asp ser cys Asn Asn Phe Met Leu Thr Tyr Asn Lys Val Glu 
2645 2650 2655 

Asn Met Thr Pro Arg Asp Leu Gly Ala Cys lie Asp cys Asn Ala 
2660 2665 2670 

Arg His He Asn Ala Gin val Ala Lys Ser His Asn val ser Leu 
2675 2680 2685 

lie Trp Asn val Lys Asp Tyr Met ser Leu Ser Glu Gin Leu Arg 
2690 2695 2700 

Lys Gin lie Arg ser Ala Ala Lys Lys Asn Asn lie Pro Phe Arg 
2705 ~ 2710 2715 

Leu Thr cys Ala Thr Thr Arg Gin val val Asn val lie Thr Thr 
2720 2725 2730 

Lys lie ser Leu Lys Gly Gly Lys lie val Ser Thr Cys Phe Lys 
2735 2740 2745 

Leu Met Leu Lys Ala Thr Leu Leu cys val Leu Ala Ala Leu Val 
2750 2755 2760 

Cys Tyr lie Val Met Pro val His Thr Leu Ser lie His Asp Gly 
2765 2770 2775 

Tyr Thr Asn Glu lie lie Gly Tyr Lys Ala lie Gin Asp Gly val 
2780 2785 2790 

Thr Arg Asp lie lie Ser Thr Asp Asp cys Phe Ala Asn Lys His 
2795 2800 2805 

Ala Gly Phe Asp Ala Trp Phe Ser Gin Arg Gly Gly ser Tyr Lys 
2810 2815 2820 

Asn Asp Lys ser Cys Pro val Val Ala Ala lie lie Thr Arg Glu 
2825 2830 2835 

lie Gly Phe lie val Pro Gly Leu Pro Gly Thr Val Leu Arg Ala 
2840 2845 2850 

lie Asn Gly Asp Phe Leu His Phe Leu Pro Arg Val Phe Ser Ala 
2855 2860 2865 
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val Gly Asn He cys Tyr Thr pro Ser Lys Leu lie Glu Tyr ser 
2870 2875 

Asp .Phe Ala Thr ser Ala cys val Leu Ala Ala Glu Cys Thr He 
2885 2890 zey5 

Phe Lys Asp Ala Met Gly Lys Pro val Pro Tyr cys Tyr Asp Thr 
2900 2905 * 

Asn Leu Leu Glu Gly ser lie ser Tyr ser Glu Leu Arg Pro Asp 
2915 2920 

Thr Arg Tyr val Leu Met Asp Gly ser He He Gin Phe Pro Asn 
2930 2935 ^»hu 

Thr Tyr Leu Glu Gly Ser Val Arg Val Val Thr Thr Phe Asp Ala 
2945 2950 ^y^s 

Glu Tyr cys Arg His Gly Thr cys Glu Arg Ser Glu Val Gly He 
2960 2965 

cys Leu ser Thr Ser Gly Arg Trp val Leu Asn Asn Glu His Tyr 
3 2975 2 980 2985 

Arg Ala Leu Ser Gly Val Phe cys Gly val Asp Ala^ Met Asn Leu 
3 2990 2995 50 

He Ala Asn He Phe Thr Pro Leu Val Gin Pro val Gly Ala Leu 
3005 3010 3U±a 

Asp val ser Ala ser val Val Ala Gly Gly lie lie Ala He Leu 
3020 3025 3030 

val Thr cys Ala Ala Tyr Tyr Phe Met Lys Phe Arg Arg val Phe 
3035 3040 304b 

Gly Glu Tyr Asn His val Val Ala Ala Asn Ala Leu Leu Phe Leu 
3 3050 3055 3060 

Met ser Phe Thr He Leu Cys Leu val Pro Ala Tyr ser Phe Leu. 
3065 3070 3075 

Pro Gly val Tyr ser val Phe Tyr Leu Tyr Leu Thr Phe Tyr Phe 
3080 3085 -5U yu 

Thr Asn Asp val ser Phe Leu Ala His Leu Gin Trp Phe Ala Met 
3095 3100 3-Lu:> 

Phe ser Pro lie val Pro Phe Trp lie Thr Ala lie Tyr val Phe 
3110 3115 3120 
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evs He ser Leu Lys His cys His Trp Phe Phe Asn Asn Tyr Leu 
y 3125 3130 3135 

Arg Lys Arg Val Met Phe Asn Gly Val Thr Phe ser Thr Phe Glu 
3140 3145 

Glu Ala Ala Leu Cys Thr Phe Leu Leu Asn Lys Glu Met Tyr Leu 
3155 3160 3J.o:> 

Lys Leu Arg ser Glu Thr Leu Leu Pro Leu Thr Gin Tyr Asn Arg 
3170 3175 3J - BU 

Tyr Leu Ala Leu Tyr Asn Lys Tyr Lys Tyr Phe ser Gly Ala Leu 
3185 3190 

asp Thr Thr ser Tyr Arg Glu Ala Ala Cys cys His Leu Ala Lys 
3200 3205 ^xu 

Ala Leu Asn Asp Phe Ser Asn Ser Gly Ala Asp Val Leu Tyr Gin 
3215 3220 

Pro Pro Gin Thr Ser He Thr ser Ala val Leu Gin Ser Gly Phe 
3230 3235 3Z4U 

Arg Lys Met Ala Phe Pro Ser Gly Lys val Glu Gly cys Met val 
3245 3250 3255 

Gin val Thr Cys Gly Thr Thr Thr Leu Asn Gly Leu Trp Leu Asp 
3260 3265 3Z70 

Asp Thr val Tyr cys Pro Arg His Val He cys Thr Ala Glu Asp 
3275 3280 3285 

Met Leu Asn Pro Asn Tyr Glu Asp Leu Leu He Arg Lys Ser Asn 
3290 3295 3300 

His ser Phe Leu val Gin Ala Gly Asn Val Gin Leu Arg val lie 
3305 3310 3315 

Gly His ser Met Gin Asn cys Leu Leu Arg Leu Lys val Asp Thr 
3320 3325 3330 

ser Asn Pro Lys Thr Pro Lys Tyr Lys Phe val Arg lie Gin Pro 
3335 3340 " 4:) 

Gly Gin Thr Phe ser Val Leu Ala Cys Tyr Asn Gly ser Pro Ser 
3350 3355 3360 

Glv Val Tyr Gin cys Ala Met Arg Pro Asn His Thr He Lys Gly 
3365 3370 3375 
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ser Phe Leu Asn Gly ser cys Gly ser val Gly Phe Asn He Asp 
3380 3385 

Tyr as §5 cys val ser Phe cys Q Tyr Met His His Met. Glu Leu Pro 

Thr Gly val His Ala Gly Thr Asp Leu Glu Gly Lys Phe Tyr Gly 
3410 3415 

Pro Phe val Asp Arg Gin Thr Ala Gin Ala Ala G\y Thr Asp Thr 
3425 3430 a^j^ 

Thr lie Thr Leu Asn val Leu Ala Trp Leu Tyr Ala Ala Val lie 
3440 3445 

Asn Gly 5 Asp Arg Trp Phe Leu Q Asn Arg Phe Thr Thr. Thr Leu Asn 

Asp Phe Asn Leu val Ala Met Lys Tyr Asn Tyr Glu Pro Leu Thr 
3470 3475 3HOU 

Gin Asp His val Asp He Leu Gly Pro Leu Ser Ala Gin Thr Gly 
3485 3490 

He Ala val Leu Asp Met cys Ala Ala Leu Lys Glu Leu Leu Gin 
^nn 3505 33±yj 



3500 

Gly 
3515 



Asn Gly_ Met Asn Gly Arg Thr Q He Leu Gly Ser Thr.. He Leu Glu 

Asp Glu Phe Thr Pro Phe Asp Val Val Arg Gin cys Ser Gly Val 
3530 3535 3 

Thr Phe Gin Gly Lys Phe Lys Lys lie Val Lys Gly Thr His His 
3545 3550 

Trp Met Leu Leu Thr Phe Leu Thr Ser Leu Leu lie Leu Val Gin 
3560 3565 

ser Thr Gin Trp Ser Leu Phe Phe Phe val Tyr Glu Asn Ala Phe 
3575 3580 jjoj 

Leu Pro Phe Thr Leu Gly lie Met Ala He Ala Ala cys Ala Met 
3590 3595 

Leu Leu val Lys His Lys His Ala Phe Leu cys Leu Phe Leu Leu 
3605 3610 

Pro ser Leu Ala Thr val Ala Tyr Phe Asn Met val Tyr Met Pro 
3620 3 °25 

page 89 



1er ctepot 



S226CAS111.ST25 

Ala floe Trp val Met Ar 9 Ile Met Thr Tr P "-eu Glu Leu Ala Asp 
3635 3640 3645 

Thr sen Leu Ser Gly Tyr Arg Leu Lys Asp cys val Met Tyr Ala 
3650 3655 3660 

Ser A I*r Leu Val Leu Leu Ile Leu Met Thr Ala Arg Thr Val Tyr 
3o65 3670 3675 

Asp A I£n Ala Ala Arg Ar 9 Val Tr P Thr Leu Met Asn val lie Thr 
3680 3685 3690 

LeU olL Tyr Lys val Tyr 7 ^ r Gl y Asn Ala Le " Asp Gin Ala lie 
3695 3700 3705 

ser Met Trp Ala Leu Val lie ser Val Thr ser Asn Tyr ser Gly 
3710 3715 3720 

val va l T hr Thr lie Met Phe Leu Ala Arg Ala lie val Phe Val 
i7 " 3730 3735 

CyS XtL GlU Tyr Tyr Pro Leu Phe 11 e Thr Gl V Asn Thr Leu 

3/ 40 3745 3 750 

Gln c yf c 11 e M et Leu val Tyr cys Phe Leu Gly Tyr cys cys cys 
i/J1 3760 3765 

cys Tyr Phe Gly Leu Phe cys Leu Leu Asn Arg Tyr phe Arg Leu 
5//0 3775 3780 

Thr Leu Gly Val Tyr Asp Tyr Leu val ser Thr Gin Glu Phe Arg 
a/Si 3790 3795 s 

Tyr "Inn AS " Ser Gln Gly Leu Pro Pro ser ser lie Asp 

aouu 3805 3810 

Ala S?r LyS LeU Asn 11 e L £?„ Leu Leu Gly Ile Gly Gly Lys Pro 

3820 3825 

CyS Ijfn Lys Val Ala Thr Va1 Gln Ser L y s Met Ser Asp val Lys 
J8 30 3835 3840 

CyS Smc Ser Va1 Val Leu Leu Ser va1 Leu Gln Gln Leu Arg val 
3845 3850 3855 

GlU flfin Ser Ser Lys LGU Ala Gln cys val Gln Leu His Asn 

3«b0 3865 3870 

ASP 3875 L6U Ala LyS 3880 ^ ^ Gl " 3885 M6t 
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val ser Leu Leu Ser val Leu Leu ser Met Gin f y Ala Val Asp 
3890 3895 

He ash Arg Leu cys Glu Glu Met Leu Asp Asn Arg Ala Thr Leu 
3905 3910 

Gin Ala He Ala Ser Glu Phe ser ser Leu Pro Ser Tyr Ala Ala 
3920 392S 

Tyr Ala Thr Ala Gin Glu Ala Tyr Glu Gin Ala val Ala Asn Gly 
3935 3940 3 

Asp ser Glu val val Leu Lys Lys Leu Lys Lys Ser Leu Asn val 
3950 3955 53 

Ala Lys__ ser Glu Phe Asp Arg^ Asp Ala Ala Met Gln $ Arg Lys Leu 



3965 



Glu Lys. Met Ala Asp Gin Ala. Met Thr Gin Met Tyr^ Lys Gin Ala 



3980 



Arg ser Glu Asp Lys Arg Ala Lys Val Thr Ser Ala Met Gin Thr 
• 3995 4000 huvj 

Met Leu Phe Thr Met Leu Arg Lys Leu Asp Asn Asp Ala Leu Asn 
4010 4015 

Asn He He Asn Asn Ala Arg Asp Gly Cys Val Pro Leu Asn He 
4025 4030 

He Pro Leu Thr Thr Ala Ala Lys Leu Met val val Val Pro Asp 
4040 4045 

Tyr Gly 5 Thr Tyr Lys Asn Thr Q cys Asp Gly Asn Thr g Phe Thr Tyr 

Ala ser Ala Leu Trp Glu lie Gin Gin val val Asp Ala Asp Ser 
4070 4 075 ituou 

Lys Ile_ val Gin Leu Ser GlU Q He Asn Met Asp Asr^ Ser Pro Asn 



4085 



Leu Ala Trp Pro Leu He val Thr Ala Leu Arg Ala Asn Ser Ala 

4100 410 5 * J " LU 

val Lys Leu Gin Asn Asn Glu Leu Ser Pro Val Ala Leu Arg Gin 

4115 4120 id.*? 

Met ser cys Ala Ala Gly Thr Thr Gin Thr Ala Cys Thr Asp Asp 

4130 4135 * ±HU 
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Asn Ala Leu Ala Tyr Tyr Asn Asn ser Lys Gly Gly Arg Phe val 
4145 4150 4155 

Leu Ala Leu Leu Ser Asp His Gin Asp Leu Lys Trp Ala Arg Phe 
4160 4165 4170 

Pro Lys Ser Asp Gly Thr Gly Thr lie Tyr Thr Glu Leu Glu Pro 
4175 4180 4185 

Pro cys Arg Phe Val Thr Asp Thr Pro Lys Gly Pro Lys Val Lys 
4190 ~ 4195 4200 

Tyr Leu Tyr Phe lie Lys Gly Leu Asn Asn Leu Asn Arg Gly Met 
4205 4210 4215 

Val Leu Gly Ser Leu Ala Ala Thr Val Arg Leu Gin Ala Gly Asn 
4220 4225 4230 

Ala Thr Glu Val Pro Ala Asn ser Thr val Leu Ser Phe cys Ala 
4235 4240 4245 

Phe Ala Val Asp pro Ala Lys Ala Tyr Lys Asp Tyr Leu Ala Ser 
4250 4255 4260 

Gly Gly Gin Pro lie Thr Asn Cys val Lys Met Leu cys Thr His 
4265 4270 4275 

Thr Gly Thr Gly Gin Ala lie Thr val Thr Pro Glu Ala Asn Met 
4280 4285 4290 

Asp Gin Glu ser Phe Gly Gly Ala Ser Cys Cys Leu Tyr cys Arg 
4295 4300 4305 

Cys His lie Asp His Pro Asn Pro Lys Gly Phe Cys Asp Leu Lys 
4310 4315 4320 

Gly Lys Tyr Val Gin lie Pro Thr Thr cys Ala Asn Asp Pro Val 
4325 4330 4335 

Gly Phe Thr Leu Arg Asn Thr val Cys Thr val Cys Gly Met Trp 
4340 4345 4350 

Lys Gly Tyr Gly Cys ser cys Asp Gin Leu Arg Glu Pro Leu Met 
4355 4360 4365 

Gin ser Ala Asp Ala ser Thr phe Leu Asn Gly Phe Ala val 
4370 4375 4380 

<210> 75<211> 2695<212> PRT<213> CORONAVIRUS<400> 75 

Arg val cys Gly Val ser Ala Ala Arg Leu Thr Pro cys Gly Thr Gly 
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10 



15 



Thr ser Thr Asp val val Tyr Arg Ala Phe Asp lie Tyr Asn Glu Lys 
20 25 30 



val Ala Gly Phe Ala Lys Phe Leu Lys Thr Asn Cys Cys Arg Phe Gin 
35 40 45 



Glu Lys Asp Glu Glu Gly Asn Leu Leu Asp ser Tyr Phe val val Lys 
50 55 60 



Arg His Thr Met Ser Asn Tyr Gin His Glu Glu Thr lie Tyr Asn Leu 
65 70 75 80 



Val Lys Asp Cys Pro Ala Val Ala val His Asp Phe Phe Lys Phe Arg 
85 90 95 



Val Asp Gly Asp Met val Pro His lie ser Arg Gin Arg Leu Thr 
100 105 110 



Tyr Thr Met Ala Asp Leu Val Tyr Ala Leu Arg His Phe Asp Glu Gly 
115 120 ~ 125 



Asn cys Asp Thr Leu Lys Glu lie Leu val Thr Tyr Asn cys Cys Asp 
130 135 140 



Asp Asp Tyr Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro 
145 150 155 160 



Asp lie Leu Arg val Tyr Ala Asn Leu Gly Glu Arg val Arg Gin Ser 
165 170 175 



Leu Leu Lys Thr val Gin Phe Cys Asp Ala Met Arg Asp Ala Gly lie 
180 185 ~ 190 



val Gly Val Leu Thr Leu Asp Asn Gin Asp Leu Asn Gly Asn Trp Tyr 
195 200 205 



Asp Phe Gly Asp Phe Val Gin Val Ala Pro Gly cys Gly val Pro lie 
210 215 220 



val Asp ser Tyr Tyr Ser Leu Leu Met Pro lie Leu Thr Leu Thr Arg 
225 230 235 240 



Ala Leu Ala Ala Glu Ser His Met Asp Ala Asp Leu Ala Lys Pro Leu 
245 250 255 



lie Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr Glu Glu Arg Leu Cys 
260 26S 270 



Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp Gin Thr Tyr His Pro Asn 
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275 280 285 

Cys lie Asn Cys Leu Asp Asp Arg Cys lie Leu His Cys Ala Asn Phe 
290 295 300 

Asn val Leu Phe ser Thr Val Phe Pro pro Thr Ser Phe Gly Pro Leu 
305 310 315 320 

val Arg Lys lie Phe val Asp Gly Val Pro Phe val Val Ser Thr Gly 
325 330 335 

Tyr His Phe Arg Glu Leu Gly Val val His Asn Gin Asp val Asn Leu 
340 345 350 

His ser ser Arg Leu Ser Phe Lys Glu Leu Leu val Tyr Ala Ala Asp 
355 360 365 

Pro Ala Met His Ala Ala Ser Gly Asn Leu Leu Leu Asp Lys Arg Thr 
370 375 380 

Thr Cys Phe Ser val Ala Ala Leu Thr Asn Asn val Ala Phe Gin Thr 
385 390 395 400 

Val Lys Pro Gly Asn phe Asn Lys Asp Phe Tyr Asp Phe Ala val ser 
405 410 415 

Lys Gly Phe Phe Lys Glu Gly Ser ser val Glu Leu Lys His Phe Phe 
420 425 430 

Phe Ala Gin Asp Gly Asn Ala Ala lie ser Asp Tyr Asp Tyr Tyr Arg 
435 440 K '44?; ' y 

Tyr Asn Leu Pro Thr Met cys Asp lie Arg Gin Leu Leu Phe val val 
450 455 460 

Glu Val Val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly Cys lie Asn 
465 470 475 480 

Ala Asn Gin val lie Val Asn Asn Leu Asp Lys ser Ala Gly Phe Pro 
485 490 495 

Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr Asp ser Met Ser Tyr 
500 505 510 

Glu Asp Gin Asp Ala Leu Phe Ala Tyr Thr Lys Arg Asn Val lie Pro 
515 520 525 

Thr lie Thr Gin Met Asn Leu Lys Tyr Ala lie ser Ala Lys Asn Arg 
530 535 540 

Ala Arg Thr val Ala Gly Val Ser lie Cys ser Thr Met Thr Asn Arg 
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545 



550 555 560 



Gin Phe His Gin Lys Leu Leu Lys ser lie Ala Ala Thr Arg Gig Ala 
565 >/u 

Thr val val He Gly Thr ser Lys Phe Tyr Gly Gly Trp His Asn Met 
580 585 5yu 

Leu Lys Thr val Tyr Ser Asp val Glu Thr Pro His Leu Met Gly Trp 

Asp Tyr Pro Lys cys Asp Arg Ala Met Pro Asn Met Leu Arg He Met 
610 615 D 

Ala ser Leu val Leu Ala Arg Lys His Asn Thr cys Cys Asn Leu ser 

His Arg Phe Tyr Arg. Leu Ala Asn Glu cys Ala Gin Val Leu ser Glu 

Met val Met Cys Gly Gly ser Leu Tyr val Lys Pro Gly Gly Thr ser 
660 665 ° 

ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn ser Val Phe Asn He Cys 

Gin Ala val Thr Ala Asn val Asn Ala Leu Leu ser Thr Asp Gly Asn 
690 695 /uu 

Lys lie Ala Asp Lys Tyr Val Arg Asn Leu Gin His Arg Leu Tyr Glu 
705 710 715 

cys Leu Tyr Arg Asn Arg Asp val Asp His Glu Phe val Asp Glu Phe 

Tyr Ala ryr Leu Arg Lys His Phe ser Met Met He Leu Ser Asp Asp 
740 745 /:>u 

Ala Val val cys Tyr Asn Ser Asn Tyr Ala Ala Gin Gly Leu val Ala 
755 ' 760 /t>:) 



ser lie Lys Asn Phe Lys Ala val Leu Tyr Tyr Gin Asn Asn Val Phe 
770 775 780 



Met ser Glu Ala Lys cys Trp Thr Glu Thr Asp Leu Thr Lys Gly Pro 
785 790 /y:> 

His Glu Phe cys Ser Gin His Thr Met Leu val Lys Gin Gly Asp Asp 
805 81U 

Tvr val Tyr Leu Pro Tyr Pro Asp Pro Ser Arg He Leu Gly Ala Gly 
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820 825 830 

Cys Phe Val Asp Asp lie Val Lys Thr Asp Gly Thr Leu Met He Glu 
835 840 845 

Arg Phe Val Ser Leu Ala lie Asp Ala Tyr Pro Leu Thr Lys His Pro 
850 855 860 

Asn Gin Glu Tyr Ala Asp Val Phe His Leu Tyr Leu Gin Tyr lie Arq 
865 870 875 880 

Lys Leu His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr ser val 
885 890 895 

Met Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe Tyr 
900 905 910 

Glu Ala Met Tyr Thr Pro His Thr Val Leu Gin Ala val Gly Ala cys 
915 920 925 

val Leu Cys Asn Ser Gin Thr ser Leu Arg cys Gly Ala Cys lie Arq 
930 935 940 

Arg Pro Phe Leu cys Cys Lys Cys Cys Tyr Asp His val He Ser Thr 
945 950 955 960 

Ser His Lys Leu Val Leu Ser Val Asn Pro Tyr Val Cys Asn Ala Pro 
965 970 975 

Gly cys Asp val Thr Asp val Thr Gin Leu Tyr Leu Gly Gly Met Ser 
980 985 990 

Tyr Tyr Cys Lys ser His Lys Pro Pro He Ser Phe Pro Leu cys Ala 
995 1000 1005 

Asn Gly Gin Val Phe Gly Leu Tyr Lys Asn Thr cys val Gly ser 
1010 1015 1020 

Asp Asn val Thr Asp Phe Asn Ala lie Ala Thr Cys Asp Trp Thr 
1025 1030 1035 

Asn Ala Gly Asp Tyr lie Leu Ala Asn Thr Cys Thr Glu Arq Leu 
1040 1045 1050 

Lys Leu Phe Ala Ala Glu Thr Leu Lys Ala Thr Glu Glu Thr Phe 
1055 1060 1065 

Lys Leu ser Tyr Gly He Ala Thr Val Arg Glu Val Leu Ser Asp 
1070 1075 1080 

Arg Glu Leu His Leu Ser Trp Glu val Gly Lys Pro Arg Pro Pro 
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1085 



1090 1095 



L eu AW. Arg Asn Tyr val Phe. Thr Gly Tyr Arg val^ Thr Lys Asn 



1100 



ser Lys, «1 Ile Gl * SSo Th '' ^5 



1115 



Gly Asp Ala val val Tyr Arg Gly Thr Thr Thr Tp Lys Leu Asn 
1130 1X " 

val Gly asp Tyr Phe val Leu Thr ser His Thr val,. Met Pro Leu 



11*5 ' * H50 

Ala 
1160 



ser Ala Pro Thr Leu val Pro Gin Glu His Tyr Val Arg He Thr 
1160 1165 

Gly Leu 5 Tyr Pro Thr Leu Asn Q He ser Asp Glu Phe $ ser ser Asn 

val Ala ash Tyr Gin Lys val Gly Met Gin Lys Tvr^ ser Thr Leu 
1190 liy:> 

Gin Gly Pro Pro Gly Thr Gly Lys Ser His Phe Ala He Gly Leu 
1205 1210 

Ala Leu Tyr Tyr Pro ser Ala Arg He Val Tyr Thr Ala cys Ser 
1220 1225 

His Ala Ala val Asp Ala Leu cys Glu Lys Ala Leu Lys Tyr Leu 
1235 1240 

Pro lie asp Lys Cys ser Arg He He Pro Ala Arg Ala Arg val 
1250 I 255 

Glu cys Phe Asp Lys Phe Lys Val Asn Ser Thr Leu $ Glu Gin Tyr 
1265 xz/u 

val Phe cys Thr val Asn Ala Leu Pro Glu Thr Thr Ala Asp He 
1280 i285 

val val Phe Asp Glu He ser Met Ala Thr Asn Tvr Asp Leu. ser 
1295 1300 

val val Asn Ala Arg Leu Arg Ala Lys His Tyr val Tyr lie Gly 
1310 I 315 

Asp Pro Ala Gin Leu Pro Ala Pro Arg Thr Leu Leu Thr Lys Gly 
1325 1330 

Thr Leu Glu Pro Glu Tyr Phe Asn Ser val cys Arg Leu Met Lys 
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Thr 11^ Gly Pro Asp Met Phe^ Leu Gly Thr cys Arg Arg cys Pro 
Ala Glu Q He val Asp Thr Va^ ser Ala Leu Val Tyr^ Asp Asn Lys 
Leu Ly^ Ala His Lys Asp Ly^ ser Ala Gin Cys Phe. Lys Met Phe 

Tyr tSSo Gly val Ile Thr Ills Asp va1 ser ser fljo Ile Asn Ar * 

Pro Gin He Gly val val Arg Glu Phe Leu Thr Arg Asn Pro Ala 
-"-i- j 1420 1425 

Trp Arg Lys Ala val Phe lie Ser Pro Tyr Asn ser Gin Asn Ala 
X ^ 3W 1435 1440 

Val 1445 LyS 11 6 L6U S| 0 Leu Pro Thr Gln Jjg val Asp ser 

1460 GlU Egc Tyr Val l1e Phe Th ' «1" Thr Thr 

1465 1470 

Glu Thr Ala His ser Cys Asn Val Asn Arg Phe Asn Val Ala He 
J ^ t/ J 1480 1485 

ThP TSo LyS 116 Gly gf 5 L6U C * s Ile Met f|S 0 Asp Arg Asp 

Leu Tyr. Asp Lys Leu Gin Phe^ Thr Ser Leu Glu lie. Pro Arg Arg 

Asn val Ala Thr Leu Gin Ala Glu Asn val Thr Gly Leu Phe Lys 

1530 

Asp cys ser Lys He He Thr Gly Leu His Pro Thr Gin Ala Pro 
J - JD J 1540 1545 

Thr His Leu ser val Asp lie Lys Phe Lys Thr Glu Gly Leu cys 
33U 1555 1560 3 

val Asp s He Pro Gly He PrO Q Lys Asp Met Thr Tyr. Arg Arg Leu 

lie ser Met Met Gly Phe Lys Met Asn Tyr Gin Val Asn Gly Tyr 
ou 1585 2590 

Pro Asn Met Phe He Thr Arg Glu Glu Ala He Arg His Val Arg 
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1595 1600 1605 

Ala Trp lie Gly Phe Asp Val Glu Gly Cys His Ala Thr Arg Asp 
1610 1615 

Ala val Gly Thr Asn Leu Pro Leu Gin Leu Gly Phe ser Thr Gly 
1625 1630 3 

val Asn Leu Val Ala val Pro Thr Gly Tyr Val Asp Thr Glu Asn 
1640 1645 lb: > u 

Asn Thr Glu Phe Thr Arg Val Asn Ala Lys Pro Pro Pro Gly Asp 
1555 1660 j-oo3 

Gin Phe Lys His Leu He Pro Leu Met Tyr Lys Gly Leu Pro Trp 
1670 1675 J-DJ5U 

Asn val val Arg He Lys lie val Gin Met Leu ser Asp Thr Leu 
1685 1690 

Lys Leu ser Asp Arg val^ val Phe val Leu Trp Q Ala His Gly 

Phe Glu Leu Thr Ser Met Lys Tyr Phe val Lys lie Gly Pro Glu 
1715 I 720 x ' 

Arg Thr cys cys Leu cys Asp Lys Arg Ala Thr cys Phe ser Thr 
1730 I 735 ■ L/4U 

ser Ser Asp Thr Tyr Ala Cys Trp Asn His ser val Gly Phe Asp 
1745 1750 1/33 

Tyr val Tyr Asn Pro Phe Met He Asp Val Gin Gin Trp Gly Phe 
1760 176 5 i//u 

Thr Gly Asn Leu Gin Ser Asn His Asp Gin His cys Gin val His 
1775 1780 178:> 

Gly Asn Ala His val Ala Ser cys Asp Ala lie Met Thr Arg cys 
1790 1795 1800 

Leu Ala val His Glu cys Phe val Lys Arg val Asp Trp Ser val 
1805 1810 I 815 

Glu Tyr pro He He Gly Asp Glu Leu Arg val Asn ser Ala Cys 
1820 i825 1830 

Arg Lys_ val Gin His Met Val Q val Lys Ser Ala Leu $ Leu Ala Asp 



1835 



Lys Phe pro Val Leu His Asp He Gly Asn Pro Lys Ala He Lys 
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1850 1855 1860 

cys val Pro Gin Ala Glu Val Glu Trp Lys Phe Tyr Asp Ala Gin 
1865 1870 1875 

Pro Cys ser Asp Lys Ala Tyr Lys lie Glu Glu Leu Phe Tyr Ser 
1880 1885 1890 

Tyr Thr His His As P L V S Phe Thr Asp Gly Val cys Leu Phe 

1895 1900 1905 

Trp $%}~ Cys Asn Va1 As P Ar 9 Tyr Pro Ala Asn Ala lie Val Cys 
1910 1915 1920 

Arg Asp Thr Ar 9 val Leu Ser Asn Leu Asn Leu Pro Gly cys 

1925 1930 1935 

Asp 5lX~ Gly Ser Leu Tyr Val Asn Lys "is Ala Phe His Thr Pro 
1940 1945 1950 

Ala f!j?r. Asp Lys Ser Ala Phe Thr Asn Leu Lys Gin Leu Pro Phe 
1955 I960 1965 

Phe T5£« Tyr ser Asp ser Pro c ys Glu ser His Gly Lys Gin val 
1970 1975 1980 

Val ^So. Asp 11 e Asp Tyr Val Pro Leu L ys Ser Ala Thr Cys lie 
1985 1990 1995 

Thr £££L Cys Asn L€U Gl y Gly Ala Val c ys Arg His His Ala Asn 
2000 2005 2010 

Glu I^r- Arg Gln Tyr Leu AS P Ala T Y r Asn Met Met He ser Ala 
2015 2020 2025 

Gly ™™ Ser Leu Trp Ile Tyr L y s Gln phe As P Thr Tyr Asn Leu 
2030 2035 2040 

Trp ^2r. Thr phe Thr Arg Leu Gln ser Leu Glu Asn val Ala Tyr 
2045 2050 2055 

Asn val Asn Lys Gly His Phe As P Gly His Ala Gly Glu Ala 

2060 2065 2070 

Pro Val ser lie lie Asn Asn Ala val Tyr Thr Lys val Asp Gly 
2075 2080 2085 

11 e ™EL va1 Glu 11 e phe Glu Asn L ys Thr Thr Leu Pro Val Asn 
2090 2095 2100 

val Ala Phe Glu Leu Trp Ala Lys Arg Asn lie Lys Pro val Pro 
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2105 2110 2115 

Glu He Lys He Leu Asn Asn Leu Gly val Asp lie Ala Ala Asn 
2120 2125 

Thr val He Trp Asp Tyr Lys Arg Glu Ala pro Ala His val ser 
2135 2140 z-L4o 

Thr He Gly val cys Thr Met Thr Asp He Ala Lys Lys Pro Thr 
2150 2155 L ° 

Glu ser Ala cys ser Ser Leu Thr Val Leu Phe Asp Gly Arg Val 
2165 2170 * ' s 

Glu Gly Gin val Asp Leu Phe Arg Asn Ala Arg Asn Gly Val Leu 
2180 2185 L 3U 

He Thr Glu Gly ser Val Lys Gly Leu Thr Pro ser Lys Gly Pro 
2195 2200 * U3 

Ala Gin Ala Ser val Asn Gly Val Thr Leu lie Gly Glu ser Val 
2210 2215 ^ 

Lys Thr Gin Phe Asn Tyr Phe Lys Lys val Asp Gly lie He Gin 
y 2225 22 30 2235 

Gin Leu Pro Glu Thr Tyr Phe Thr Gin Ser Arg Asp Leu Glu Asp 
2240 2245 ifzv 

Phe Lys Pro Arg Ser Gin Met Glu Thr Asp Phe Leu Glu Leu Ala 
2255 2260 zzco 

Met Asp Glu Phe He Gin Arg Tyr Lys Leu Glu Gly Tyr Ala Phe 
2270 2275 228 

Glu His He val Tyr Gly Asp Phe Ser His Gly Gin Leu Gly Gly 
2285 2290 

Leu His Leu Met lie Gly Leu Ala Lys Arg Ser Gin Asp ser pro 
2300 2305 2 310 

Leu Lys Leu Glu Asp Phe He Pro Met Asp ser Thr val Lys Asn 
2315 2320 tsto 

Tyr Phe He Thr Asp Ala Gin Thr Gly ser ser Lys Cys val cys 
2330 2335 

ser val He Asp Leu Leu Leu Asp Asp Phe val Glu He He Lys 
2345 2350 z^dd 

ser Gin Asp Leu Ser val lie ser Lys val Val Lys val Thr He 
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2360 



2365 



2370 



Asp Tyr Ala Glu lie Ser Phe Met Leu Trp cys Lys Asp Gly His 
2375 - 2380 2385 



val Glu Thr Phe Tyr Pro Lys Leu Gin Ala Ser Gin Ala Trp Gin 
2390 2395 2400 



pro Gly val Ala Met Pro Asn Leu Tyr Lys Met Gin Arg Met Leu 
2405 2410 2415 



Leu Glu Lys Cys Asp Leu Gin Asn Tyr Gly Glu Asn Ala Val lie 
2420 2425 2430 



Pro Lys Gly lie Met Met Asn val Ala Lys Tyr Thr Gin Leu cys 
2435 2440 2445 



Gin Tyr Leu Asn Thr Leu Thr Leu Ala val Pro Tyr Asn Met Arg 
2450 2455 2460 



val lie His Phe Gly Ala Gly ser Asp Lys Gly val Ala Pro Gly 
2465 2470 2475 



Thr Ala Val Leu Arg Gin Trp Leu Pro Thr Gly Thr Leu Leu Val 
2480 2485 2490 



Asp Ser Asp Leu Asn Asp Phe val Ser Asp Ala Asp Ser Thr Leu 
2495 2500 2505 



He Gly Asp Cys Ala Thr Val His Thr Ala Asn Lys Trp Asp Leu 
2510 2515 2520 



lie lie ser Asp Met Tyr Asp Pro Arg Thr Lys His val Thr Lys 
2525 2530 ~ 2535 



Glu Asn Asp Ser Lys Glu Gly Phe Phe Thr Tyr Leu Cys Gly Phe 
2540 2545 2550 



He Lys Gin Lys Leu Ala Leu Gly Gly Ser lie Ala val Lys lie 
2555 2560 2565 



Thr Glu His Ser Trp Asn Ala Asp Leu Tyr Lys Leu Met Gly His 
2570 2575 2580 



Phe ser Trp Trp Thr Ala Phe val Thr Asn val Asn Ala Ser ser 
2585 2590 2595 



Ser Glu Ala Phe Leu lie Gly Ala Asn Tyr Leu Gly Lys Pro Lys 
2600 2605 2610 



Glu Gin lie Asp Gly Tyr Thr Met His Ala Asn Tyr lie Phe Trp 



Page 102 



S226CAS111.ST25 
2615 2620 2625 

Arg Asn Thr Asn Pro He Gin Leu Ser sen Tyr Ser Leu Phe Asp 
2630 2635 zow 

Met ser Lys Phe Pro Leu Lys Leu Arg Gly Thr Ala val Met ser 
2645 2650 ZD:>:> 

Leu Lys Glu Asn Gin He Asn Asp Met He Tyr Sen Leu Leu Glu 
2660 2665 ^ 

Lys Gly Arg Leu He He Arg Glu Asn Asn Arg val val Val Ser 
y 2675 2680 2685 

ser Asp lie Leu val Asn Asn 
2690 2695 
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